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Thay cho Lời giới thiệu 
(Tái bản lần thứ tu) 


là y học thực chứng) xuất hiện trong tất cả bộ môn y học, trên tất cả tập 

san khoa, và trở thành một trường phải mới trong thực hành y khoa. 
Đại đa số các trường y trên thế giới đếu có chương trình chỉnh khóa giảng dạy y 
học thực chứng. Nhiều hội thảo y khoa quốc tế cũng ban gốm những khóa huấn 
luyện ngắn hạn về y học thực chứng năm trang chương trình “đảo tạo liên tục” 
dành cho y bác sĩ thực hành. Có thể nói không ngoa rằng y học thực chứng là 
một phát triển quan trọng nhất, một cuộc cách mạng y khoa sảu rộng nhất trong 
thể kỉ 21. 


Y học thực chứng, như tên gọi, là thực hành y khoa dựa vào bằng chứng. 
Băng chứng được đúc kết từ các nghiên cứu khoa học công hỗ trên các tập san 
y khoa quốc tế có hệ thống bình duyệt. Trên thế giới ngày nay, có khoảng 3000 
tập san y sinh học được công nhận, và con số vẫn tăng mỗi năm. “Được cỗng 
nhận” ở đây có nghĩa là được nằm trong danh sách của tổ chức Index Medicus. 
Nếu tỉnh cả số chưa được công nhặn, số lượng tập san y sinh học lên đến 30.000. 
Tiêu chuẩn mà các tập san y học dựa vào để công bố hay không công bố một 
hải bản khoa học cũng rất khác nhau. Một số tập san như Srience, Nature, Cell, 
hay PNAS chỉ cũng bổ những bài báo khoa học má ban biển tập cho rằng thể 
hiện những cổng hiển cơ bản, những phát hiện quan trọng, hay những phương 
pháp mới có tiểm năng ng dụng rộng rãi trong cộng đồng khoa học. Theo một 
hán cáo gắn đây, các tận san nảy chỉ công bố khoảng 1u những bài báo họ nhận 
được hàng năm. Nói cách khác, họ từ chối khoảng 99% hải báo. Trong y học, các 
tận san hàng đầu như New Englanrl Jaurnal nƑ Miedlicine, Lancet, và [A MA từ chối 


T rong ba thập niễn qua, cụm tử £vience-lbiasedl mrerlicine (mà tôi tạm dịch 
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khoảng 95% các hải báo gửi đến, chỉ cũng bổ những hải báo quan trọng trang v 
khoa. Một số tận san chuyên ngành của các hiệp hội chuyên khoa có tỉ lệ chấp 
nhận cao hơn, nhưng số hải báo của họ thưởng it hơn các tập san y khoa lớn. Do 
đó, băng chứng khoa học và chất lượng bằng chứng tùy thuộc rất lửn vào tập san 
và diễn đản khoa học mà các bảng chứng được công bố. 


Phần lửn các tận san y học thường xuất hản hàng tháng, thậm chỉ hàng tuần, 
và lượng thông tin mả các tập san này công bố cực ki lớn, với hàng vạn hải bảo 
v khoa mới xuất hiện hàng tháng. Hầu như bất cử một công trình nghiễn cứu 
Y khoa nảo cũng ứng dụng các phương pháp phân tích thống kẻ để làm cư sử 
cho kết luận, và không phải phương pháp nào cũng đếu hợp lí như nhan. Mỗi 
năm, trên thể giới hiện nay có khoảng 3 triệu bài bảo khoa học được công bố. 
Có người tỉnh toán rằng để cập nhật hóa thẳng tín, chỉ riêng lĩnh vực nội khon, 
một bác sĩ trung bình phải đạc 17 bài hán mỗi ngày, 365 ngày một năm! Nhưng 
trong thực tế, không ai có thì giờ để đọc như thế. Một nghiên cửu trên các bác sĩ 
và sinh viên y khoa ở Mĩ cho thấy thời lượng hàng tuần dành ra để đọc về hệnh 
nhản mình chăm sóc giảm dẫn theo thời gian sau khi tốt nghiệp trường y. Trong 
khi sinh viên y khoa đành 90ũ phút hàng tuần để đọc háo y khoa, hác sĩ thường 
trú dành 45 phút (45% bác sĩ chẳng bao giờ đọc bảo y khoa), thì các bác sĩ cấp 
cao tốt nghiệp trên 15 năm chỉ dành 30 nhút/tuần để đọc y văn, trung số này có 
đến 30 - 40% không đọc! Do đá, với một lượng thông tin không lỗ và sự hạn chế 
về thời gian để đạc y văn, cẩn phải có phương pháp để sảng lọc những thông tin 
cần thiết, phương cách để thẩm định giả trị khoa học của thông tin, và ứng dụng 
văo việc chăm sóc sức khỏe cho một bệnh nhẫn. 


Thử thách lớn nhất của việc án dụng thông tin là phải hoán chuyển thông 
tin thu thập từ một quẩn thể để chăm sóc một cá nhân. Đỏ là một nghệ thuật 
đôi hỏi vải kỉ năng xử lỉ số liệu và kinh nghiệm lãm sàng. Đầu thể kỉ 20, nhà văn 
Herhert George Wells, cha đẻ của bộ mỗn tiểu thuyết khoa học giả tưởng, tuyên 
hổ “Trong một xã hội công nghệ hiện đại, người công dẫn phải học ba điểu: đọc, 
viết, và suy nghĩ thống kẻ” Ngày nay, trong thể kỉ 21, người hành nghề y khoa 
cũng cần ba kĩ năng: đọc bảo y khoa, truyền đạt thông tin, và xử lí dữ liệu thống 
kẻ. Cuỗn sách này được soạn ra nhắm vào việc nẵng cao ba kỉ năng đả. 


Có thể nói răng cuộc cách mạng về thông tin ngày nay đã đem lại cho bác sĩ 
cùng hệnh nhân một cơ hội và cũng là một lợi ích má họ chưa bao giờ có được 
trong vải thận niên trước đây: đỏ là sự tiến cận với thông tin y khoa. Ngày nay, 
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với một máy tính được nổi mạng internet, bất cứ ai cũng có thể tìm tất cả các tài 


liệu khoa học liên quan đến hất cử bệnh gi qua một thư viện y khoa đại chúng vĩ 


đại da Viện Y tế Quốc gia Hoa Kỳ quản lí (Medline). Người sử dụng chỉ việc gỗ 
vào tên căn bệnh là hệ thống Miedline sẽ liệt kẻ một danh sách các hải háo khoa 
học liên quan đến căn bệnh mình muốn tìm hiểu. Với số lượng thông tin khổng 
lỗ như thế, người sử dụng cần phải trang bị cho mình phương pháp thẩm định 
thông tin để trở nên chủ động hơn và thông thạo hơn về hệnh tật. Và, trong vải 
trường hợp. sự chủ động của bệnh nhãn dẫn đến những kiến thức khoa học mới 
và qua đỏ phát triển phương cách điểu trị mới chủ căn bệnh. 


Cuốn sách này có một tham vụng nhỏ: giđi thiện các phương pháp truy tìm, 
thẩm định, xử Ìí và ng dụng thẳng tín cha các mục đích lâm sảng. Bạn đọc sẽ 
tìm thấy khá nhiều khái niệm dịch tế học và một số phương pháp phản tích số 
liệu thưởng thấy trong các bái bảo y khoa trên các tận san y học quốc tế. Tôi cổ 
gắng trình bảy các khái niệm bằng một ngôn ngữ “phổ thông”: tức là hạn chế sử 
dụng các thuật ngữ khó hiểu. Bởi vi tôi sống và làm việc trang thể giới Anh ngữ, 
và một số thuật ngữ thưởng xuất phát từ tiếng Anh, nên tôi đã cổ gắng chuyển 
các thuật ngữ tử tiếng Ảnh sang tiếng Việt một cách, hi vọng là, mụn gàng và dễ 
hiểu. Thỉnh thoảng, một thuật ngữ khi dịch sang tiếng Việt củn được kẽm then 
nguyên bản tiếng Anh để bạn đọc rảnh ngoại ngữ có thể kiểm chứng. Có một số 
thuật ngữ tôi giữ nguyễn tiếng Anh vì tôi nghĩ sẽ giúp cho các bạn làm quen với 
khái niệm trong y văn tiếng Ảnh. 


Đối tượng của cuốn sách nảy là giới bác sĩ, sinh viên y khoa, và các nhà quản 
lí y tế, kể cả những người không có chuyên môn sâu về khoa học. Ngay cả bệnh 
nhắn cũng cỏ thể tìm thấy vải thông tin có ích trong sách. Nhưng đây không phải 
là một cuỗn sách loại “cook-book” (loại sách dạy nắu ăn) theo một công thức 
nào, cũng không nhằm chỉ bạn đọc cách làm phần tích số liệu như sách giản 
khoa, mà là một cuỗn sách mang tỉnh diễn dịch và giải thích các khải niệm của 
y học thực chứng cho bạn đọc. 


Theo cách nhìn và hiểu của tôi, thực hành y học thực chứng cỏ thể tôm gọn 
trong bốn lĩnh vực chỉnh: fim, đọc, suy nghĩ, và ứng dụng. Tìm có nghĩa là tìm 
dữ liệu y khoa trang kho tăng y văn thế giới. Đọc để hiểu những dữ liệu trong y 
văn. Suy nghĩ về các vấn để nguyên lí và sự thật đăng sau những dữ liệu. Và, sau 
cùng là ng dụng những dữ liệu đó vào từng trưởng hợp bệnh nhân. Do đả, sách 
được cẩu trúc thành năm nhẩn: những vẫn để nguyên li, những vẫn để về thiết 
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kế nghiên cứu, hiểu và phần tích đữ liệu, ứng dụng y học thực chứng, và phụ lục. 
Trong một số chương về phản tích đữ liệu, tôi có cũng cấp vài mã chương trình 
R cần thiết cho thực hành; nếu hạn đọc chưa quan tâm đến các vấn để kỉ thuật có 
thể bỏ qua các mã nảy mả không ảnh hưởng gì đến sự tiếp thu thông tin. 

Cuỗn sách là một kết quả của rất nhiễu lớp học về y học thực chứng và 
phương pháp nghiên cứu khoa học do Giáo sư Nguyễn Thy Khuẻ (Bộ môn Nội 
tiết học, Đại học Y Dược Thành phố Hỗ Chỉ Minh] vả tôi tổ chức trang thời gian 
lũ năm qua. Nhân dịn sách được xuất bản lẩn nảy, tôi muốn hảy tỏ lùng cắm ơn 
đến Tiến sĩ Trần Sơn Thạch đã trực tiếp góp ý cho tôi để cuốn sách hoàn hảo 
hơn. Một số bài viết trong sách này đã được đăng trên một vải tạp chỉ ở trang 
nước như Tập san Thông tin Y học dưởi dạng tôm lược, một số đã được đăng trên 
các trang web như bacsinmiiru.vn và ykhna. net. Tôi cũng muốn nhắn dịp nảy cảm 
ơn các bạn và đồng nghiện đã chuyển tải những hải viết của tôi trong quả khứ. 


Cuốn sách mả các hạn đang cẩm trên tay được xuất bản lần đầu năm 2008, vả 
tái bản ba lấn sau đó. Đây là lần tải bản thứ tư, và được Nhà xuất bản Tổng hợp 
Thành phố Hỗ Chỉ Minh phụ trách. Tỏi đã chỉnh sửa một số sai sốt má bạn đọc 
chỉ ra trước đảy, nhưng dủ vậy, tôi vẫn không đảm nỏi là hoàn hảo. Không cỏ 
cái gì hoàn hảo trên đời. Cuốn sách nảy là một nỗ lực cá nhân, và “nhân vỗ thập 
toàn” là lời giải thích tại sao trang sách có thể có thiểu sót và nhấm lẫn (dù tôi đã 
cố nắng đọc lại nhiều lẩn để tránh sai sót). Viết sách má được sự góp ý của bạn 
đọc là một vinh dự với tôi. Tôi rất mong được bạn đọc phê hình và góp ý để lần 
tái bản sau cuốn sách sẽ hoàn hảo hơn. 


Nguyễn Văn Tuấn 
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Y H0E THỰC CHỨNG: 
VÀI NÉT KHÁI QUÁT 


ra trung thể giới y khoa. Cuộc cách mạng này có tên là “Evience-based 

merlirine” (mà người viết tạm cũch là "VY học thực chứng”). Y hạc thực 
chưng là gi? Phạng trào này củ ảnh hướng gì đến bệnh nhân? Chưưng này cứ mục 
đích trả lãi hai câu hỏi đó, và thảa luận mật số vấn để liên quan đến nhàng trảa v 
học thực chững. 


Vào thận kỉ 1980, một số nhà nghiên cứu chủ ÿ đến tình hình sử dụng dịch 
vụ phẫu thuật ở vùng Đông Bắc nước Mĩ. Các nghiên cứu nảy cho thấy tỉ lệ 
phầu thuật ung thư tiến liệt tuyến và cắt tử cung dao động đến 300% giữa các 
quận có củng đặc điểm về y tế. Nhưng khác biệt về tỉ lệ phẫu thuật đục thể thủy 
tính (cataract) giữa các quận củn cao hơn nữa: 2000%! Những dữ liệu thật này 
cho thấy các bác sĩ sử dụng các tiêu chuẩn khác nhau để quyết định bệnh nhân 
nảo cần phẫu thuật. Nhưng tại sao họ dùng các qui định hay chuẩn mực khác 
nhau trang khi tất cả đếu hục cùng một hộ sách giản khoa, cùng đọc những tập 
san y khoa? 


Ƒ thửi man gẵn đây, một cuộc cách mạng âm thẩm dã và dang xảy 


1.1. Mô hình Aristotle và vấn để 


Có thể nói răng trong nhiểu thế kỉ qua và ngay cả ngày nay, quá trình và 
phương pháp chẩn đoán cũng như chữa trị bệnh tật được tiến hành theo mỗ 


hình của Aristotle. Theo mỗ hình này, người thầy thuốc đứng trước một người 
hệnh trước hết tìm hiểu căn bệnh, rối đi đến một chẩn đoán, và sau đỏ là quyết 
định một phương pháp điểu trị, hoặc là phẫu thuật, được liệu, hay tầm li trị 
liệu. Nếu phản ứng sau khi chữa trị được đánh giả là tích cực thì chẩn đnản vá 
phương pháp chữa trị được xem là đúng. Thoạt đẩu mới nghe qua thi mỗ hình 
này không cỏ gì sai và có thể nỏi là rất hợp lí. Thực ra, mỗ hình này đã từng được 
ứng dụng thành công trong y khoa từ bấy lâu nay. Chẳng hạn như khi Frederick 
G. Banting và Charles H. Best (hai nhà khoa học người Canada) phát hiện vai 
trỏ và ảnh hưởng của sự thiểu insulin trong các trường hợp tiểu đường ở thiểu 
niên thi nhương phán điều trị cũng năm ngay trong nhát hiện đó, tức là thay thể 
insulin. Phương pháp này đem lại nhiều thành công ngoạn mục trong v khoa. 
Mô hình của Banting và Best cũng là mỏ hình tiến bộ của y học trong suốt thể 
ki 20. 


Nhưng con người nói chung và giới thấy thuốc nói riêng thưởng có khuynh 
hướng tiếp nhận những gì mà họ muốn tiếp nhận. Nói cách khác, chúng ta 
thưởng có xu hưởng chủ quan. Nếu theo một lương nắng bình dân nào đỏ, một 
phương pháp điểu trị sẽ có hiệu nghiệm tốt, thì bác sĩ sẽ cảm nhận rằng nhương 
pháp đó thực sự có hiệu nghiệm, dù bằng chứng khoa học cho thấy ngược lại. 


Cho đến một vài thế hệ trước đây, ý niệm về bệnh tật rất đơn giản: bệnh nhãn 
bị nhiễm một độc tố (toxic} nào đỏ, hay một nhiễm tố, hoặc trong cơ thể có quả 
nhiều dịch tổ. Từ ý niệm nảy dẫn đến một ý tưởng là muốn chữa trị những hệnh 
như thế, chỉ cần mở một cái mạch và để cho các “độc tổ” chảy ra ngoài: trích máu 
(hay tiếng Anh gọi là hlaoad-letting). Một khi đặc tổ bị thải ra ngoài cơ thể, bệnh 
nhắn sẽ cảm thấy khảe khoản hơn. Cũng miếng như bất cử một người nào trong 
chúng ta từng hiển máu đểu thấy sau khi hiến máu, chúng ta cảm thấy khỏe hơn; 
hác sĩ thi tin rằng sau khi thải độc tổ, bệnh nhắn sẽ khỏe hơn. Đi với cả bác sĩ 
và bệnh nhắn, họ đếu cảm thấy hải lòng, vì trong cơ thể bệnh nhắn không còn 
độc tổ nữa. 


Ngày nay, chúng ta biết răng trích máu thực ra chỉ làm chao bệnh nhắn chết 
nhanh hơn. Một người lớn bình thường nếu mất đi 10% thể tích máu tuần hoàn 
của toàn cử thể là có thể có biểu hiện rỗi luạn tuần hoàn, và nếu mất 20M thi 
sốc giảm thể tích tuần hoàn có thể xảy ra, tính mạng có thể bị đe dọa rồi. Tổng 
thống Mĩ, George Washington, bị mất hơn 2 lít máu trong vòng hai ngày trước 
khi ông chết; và ông chỉ bị đau cuống họng. Ông hị lấy máu nhiều quá. Chúng 
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ta biết rằng trích máu là một thuật chữa trị nguy hiểm, kết luận này nhữ vào 
thử nghiệm lắm sảng của một hác sĩ người Pháp tên là Pierre Louis vào nắm 
1836. Pierre Lauis tiến hành một thử nghiệm mả ngày nay được xem là một thử 
nghiệm lãm sảng đổi chứng (controlled clinical trial] đâu tiên trong thể giới y 
khoa. Trong thử nghiệm nảy, Louis trị một số bệnh nhân viêm phổi bằng cách 
trích nhiễu máu, và một số bệnh nhãn khác, ông trích it máu hơn. Sau khi thử 
nghiệm, Lauis đểm số lượng bệnh nhãn chết trong hai nhóm, và đi đến kết luận 
răng trích nhiều máu là một phương pháp điểu trị nguy hiểm. Nhưng kết quả 
nghiền cứu và kết luận của Louis được truyển đi rất chậm trong thế giới y khoa. 
Phải cẩn đến cả trắm năm sau, giới bác sĩ mới bắt đẩu xem truyền mắu lại vàn 
cơ thể bệnh nhản (thay vì thải máu) như là một phương pháp điểu trị! Sau nảy, 
khi kĩ thuật phân luại máu ra đời, việc tiến mảu mới được thực hiện một cách an 
toàn hơn. Giới bác sĩ nhanh chóng đi đến kết luận là đối với những bệnh nhân 
hị bệnh nặng, duy trì mức độ hemoplobin sẽ cải thiện căn bệnh. Đứng trên khia 
cạnh lương năng binh dân, suy nghĩ này cũng hợp lí, và tiếp máu trở thành một 
cách điểu trị cũng như quản lỉ các bệnh nhãn ở trong tình trạng nguy kịch. 


Ấy thể mà khoảng 10 năm trước đây, kết quả của một nghiên cứu lâm sảng 
"“Transfusion requirements in critical care” (nhu cẩu truyểễn máu ở các bệnh 
nhắn cần cửu) được công hỗ trên Tận san New Englandl laurnal nƒ Äiedicine [3]. 
cho thấy ngoại trừ các bệnh nhãn nhi máu cơ tim cấp tỉnh (acute myocardial 
infarction), việc truyền máu cho những bệnh nhän nguy kịch với một liểu lượng 
hemopglobin trung bình không làm giảm tỉ lệ tử vong, mà có thể làm tăng nguy 
cư tử vong! Cũng như trưởng hợp HRT;, không ai biết tại sao, nhưng đó là kết 
quả, là một thực tế. Kết quả nghiên cứu này làm chẩn động các bác sĩ chuyên 
ngành hổi sức trang hệnh viện. 


Từ lãu, giới bác sĩ phương Tây thường khuyên các bà mẹ nên cho trẻ em mi 
sinh ngủ nắm sẵn, vì họ tin rằng cách ngủ này sẽ làm giảm xác suất trẻ em chết 
đột ngột hay “đột tử” (còn gọi là Sudden Infant Death Syndrame, hay 5II15). Mãi 
cho đến thập niên 1980, có người đặt vấn để là có bằng chứng nào làm cơ sử cho 
lửi khuyên này. Theo sau đó là một loạt nghiên cứu lãm sảng cho thấy rõ rằng các 
trẻ sơ sinh năm sắp có nguy cơ hị chết cao hơn các trẻ ngủ năm ngửa. Và thế là 
một phong trảo “Back to sleep” (Năm ngửa khi ngủ) được phát động để khuyến 
khích trẻ em ngủ năm ngửa. Nếu cầu hỏi trên được đặt ra vải mươi năm trước 
thi có biết hao trẻ em được cửu sỗng vi SIDS5. 
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Đẩu thập niên 1980 và 1990, giới thấy thuốc trên thể giới là những "cảm 
tỉnh viên” của một phương pháp trị liệu cỏ tên là HRT (hormone replacement 
therapy, hay củn gọi là Phương pháp thay thế kích thích tổ), thưởng được dùng 
để chữa trị những triệu chứng sau thứi kì mãn kính như nóng bừng. Thời đỏ, 
giới bác sĩ tin rằng HRT sẽ làm cho phụ nữ trẻ trung hơn, sẽ ngắn ngửa bệnh tìm 
mạch và loãïng xương trong những phụ nữ cao tuổi hay sau thời kì mãn kinh. 
Trong các trưởng y, một số giáo sư còn đi xa hơn, giảng dạy sinh viên rằng vẫn 
để HRKT chưa được dùng rộng rải trong các phụ nữ sau thửi mãn kính là một tội 
phạm trong ngành y] 

Nhưng đến năm 1998, kết quả của một nghiên cửu lắm sảng “Heart and 
Estropgen/Proagestin Replacement Study” (HERS) [1l] công bổ cho thấy estrogen 
chẳng những không ngăn ngửa bệnh tìm, mà còn làm tăng nguy cơ bị chứng vón 
cục mắu (hÌood clat). Kết quả nghiên cửu nảy làm cho giới bác sĩ lại ngẩn ngữ! 
Họ ngạc nhiên đến nỗi không tin kết quả nghiên cứu. Mới đây, một nghiên cứu 
qui mỗ khác cũng cha thấy HRT có thể hại nhiều hơn là lợi cho bệnh nhẫn [3]. 
Thể nhưng hiện nay, Premarin (một loại thuốc HRT) vẫn là loại thuốc bản chạy 
nhất vào hàng thứ ba ở MI. 

Những trường hợp khá điển hình trên đây cho thấy nhiều phương pháp trị 
liệu hiện hãảnh không có hiệu nghiệm như chúng ta tưởng. Thậm chỉ, trong quả 
trinh điều trị, người thấy thuốc còn có thể gây nên thương tổn cho bệnh nhẫn. 
Nhưng đỏ không phải là vẫn để. Vấn để là những quyết định của bác sĩ rút ra từ 
kinh nghiệm quan sát lắm sảng hàng ngày thường không có độ tĩn cậy cao. Thêm 
vào đỏ là nhân lớn các phương pháp chữa trị trong y học chưa bao giữ được kiểm 
tra, đánh giá bằng các phương pháp khoa học. Những phương pháp này được 
dùng vì bác sĩ tin rằng chủng cỏ hiệu nghiệm, và cũng như mọi niềm tín tốn 
giáo, nó không dựa vào bằng chứng khoa học. 

Điểu đáng ngạc nhiên là một ngành nghề mang danh hiệu khoa học lại cần 
phải qua một thời gian dải để ghi nhận một nguyên Ïí mả ngay cả một người bình 
thường không được huấn luyện trong khoa học cũng có thể hiểu được: dựa vào 
hãng chứng. Theo một tiớc tỉnh gắn đây, khoảng 70% các thuật điểu trị lãm sảng, 
kể cả phẫu thuật, chưa bao giở dựa vào bằng chứng khoa học! 

Thoạt đầu mới nghe qua tình trạng này, người ta äắt hẳn phải ngạc nhiên. Ấn 
tượng mả công chúng thường hướng về giới thầy thuốc là việc dùng bằng chứng 
khoa học trang khi hành nghề. Do đỏ, nếu công chủng biết răng phần lớn bác sĩ 
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không biết đến y học thực chứng sẽ là một cú sốc lớn cho họ. Nếu có người nói 
răng các hác sĩ ngày nay được đảo tạo trong một hệ thống giảo dục má khi tốt 
nghiệp họ không đủ khả năng đọc một hải báo về nghiên cứu y học, hay không 
hiết cách diễn dịch kết quả của một nghiên cứu y học, thì cũng chủng chắc sẽ còn 
sốc mạnh hơn. Nhưng tiếc rằng đỏ lại là một thực tế ngày nay. 


1.2. Y học thực chứng 


Y học thực chứng ra đời với mục đích muốn thay đổi tình trạng nảy. Nói 
một cách ngắn gọn, y học thực chứng là một phương pháp thực hành y khoa 
dưa vàa các dlữ liệu y học rnật cách sảng suất và có ý thức, nhằm nâng can chất 
lượng chẩm sắc hệnh nhận. Các dữ liệu y học ở đây là kết quả nghiên cứu y khoa 
đã được công bố trên các tập san y học chuyên mỗn. Sử dụng dữ liệu y học một 
cách “sáng suất và có ý thức” có nghĩa là người thấy thuốc phải cản nhắc, đánh 
giả, phân loại các dữ liệu nghiên cứu y học, kết hợp cùng kinh nghiệm lâm sảng 
và thông tin từ bệnh nhân. Tóm lại, cải “miảo lỉ” căn bản của y học thực chứng là 
hệnh nhân cùng làm việc với bác sĩ của họ, trang bị bằng các dữ liệu khoa học, 
để đi đến một quyết định, một sự lựa chọn tỗi ứu cho bệnh nhân. Bởi vì chỉ cỏ 
bệnh nhãn mới biết về họ chính xác hơn là bác sĩ biết về họ. 


Bản tuyên ngôn của phong trảo y học thực chứng được một nhóm hắc sĩ ở 
Ontario (Canada), khởi đầu là Giáo sư [David Sackett, cũng bố vào năm 1893 trên 
Tập san Hiện hội Y khoa Haa Kỳ ([LAMA ) và các tập san khác như Britrsh Mierlical 
Jnurnal và Lancet [4|. Bản tuyên ngỗũn này chảm ngỏi cho một cuộc tranh luận 
lầu dải và gay gắt về quyển lực, y đức, và trách nhiệm trong y khoa mả nó đang 
đe dọa thay đổi toàn bộ hệ thống y tế thể giới. 


Một trong những tranh luận không cỏ hổi kết thúc là vai trò của cảm nhận và 
khách quan khoa học. Quan điểm của nhang trào y học thực chứng là các quyết 
định y khoa về chữa trị, hay thậm chỉ chỉnh sách y tế không nên dựa vào cảm 
tính hay kinh nghiệm cá nhắn, mả cẩn phải dựa vào các dữ liệu đáng tin cậy, đã 
qua kiểm tra một cách khoa học và có hệ thống. Trong khi đó, những người “bảo 
thủ” thi cho rằng cảm nhận và kinh nghiệm cá nhân phải được tôn trọng tuyệt 
đổi trong các quyết định chữa trị bệnh nhãn. Sự khác biệt căn bản này chắc sẽ 
không ban giữ giải quyết được qua tranh luận, vì về bản chất nó là một sự khác 
hiệt miửa người có niễm tín và người không có niềm tín. 
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Từ ngày đầu tiên trong phòng khám nghiệm tử thi, mỗi sinh viên y khoa đếu 
được dạy một chân lí răng “nghề y vừa là một nghệ thuật, vừa là một khoa học”. 
Cái nghệ thuật tính hiểu hiện ở trực giác, tiên đoán, cảm nhận của người bác sĩ 
về tình trạng của một hệnh nhắn vả cách giải quyết vẫn để bằng một phản ứng 
tự nhiên hay qua kinh nghiệm tích lũy từ thực tế. 


Trực giác chắc chăn là một phần không thể thiểu được trong y khoa. Cơ thể 
con người cực kỉ phức tạp, và những sự cổ bình thưởng có thể khác nhau giữa 
các bệnh nhắn. Đứng trước một trường hợp khẩn cấp, người thấy thuốc phải 
khái quát hóa và rút gọn những vấn để phức tạp thành những nguyên lí cơ bản. 
Trong tình huồng thập tử nhất sinh đỏ, người thấy thuốc không thể nào tra cứu 
được hết tất cả các dữ liệu y học cho mợi vấn để. Thời gian tra cứu quá lẫu có thể 
đem lại nguy hiểm cho tỉnh mạng của bệnh nhân. Do đó, có lúc cẩn phải hành 
động theo cảm giắc và trực giác một cách cỏ lỉ trí. 


Và từ đó y khoa có một can đường trí thức ngắn, “trực giác, tiên để, và tiớc 
lệ. Nên hiểu câu nói đỏ là: "Phẫu thuật sớm nếu điểu kiện cho phép!” hay cụ 
thể hơn: “Ông A cai bộ không khỏe cả tháng nay; chắc không phải do cảm cúm” 
Cảm nhận/cảm giác là khia cạnh nghệ thuật rất quyến rũ đổi với người thấy 
thuốc. Nỏ mang tỉnh cá nhân. Nó ẩm áp tình người. Nó gắn gũi. Nhưng nói chủ 
cùng, nghệ thuật là cái mả người ta cẩn, và nếu một khi người bác sĩ cảm thấy 
tiếp máu là một phương án cẩn thiết cho một bệnh nhân bị viêm phổi thì đá 
không là lí do truyền máu cho bệnh nhân tư? Câu trả lời thưởng là “Vãng” Ấn 
tượng lãm sảng rất quan trọng và cẩn phải cần nhắc một cách nghiêm chỉnh. Khi 
một nữ hộ sản cảm thấy lo lắng trước một trưởng hợp trẻ sơ sinh, người bác sĩ 
phải quan tâm, cho dù chưa có thử nghiệm sinh hỏa nào cả. Nghệ thuật này cũng 
giống như một loại ảo thuật. Và một khi chúng ta tin tưởng vào phép lạ, khá má 
tưởng tượng nỗi có cái mi mả phép lạ không làm được. 


Những người nhề hình phong tráo y học thực chứng bảo vệ cảm giác tỉnh. Họ 
cho rằng đỏ không phải là một sự lười biểng trong suy nghĩ, nhưng là một kiểu 
suy nghĩ tĩnh vi, kết hợp nhiều yếu tổ khác nhau cũng như xử lỉ nhiều dữ liệu (qua 
kinh nghiệm cả nhãn) khác nhau. Đỏ là lí do mà Kasparov vẫn có thể đánh hại 
máy tính “Deep Blue" Họ lí giải rằng dữ liệu khoa học không thể dùng làm kim 
chỉ nam ch mọi quyết định y khoa. Hiện nay, số lượng thử nghiệm lắm sảng đối 
chứng còn rất ít. Mà dù cho có đây đủ dữ liệu từ thử nghiệm đi nữa, cũng khó mả 
khải quát hóa kết quả của những nghiên cứu nảy đến một cả nhân người hệnh. 
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1.3. Phản đãi 


Những người chống lại nhong trào y học thực chứng thấy nhong trào nảy là 
một bước trong nhiễu bước đi đến cơ khi hỏa và tự động hóa y khoa, và là một 
mỗi đe dọa đến người bác sĩ. Nhưng những người ủng hộ phong trảo lí giải rằng 
y học thực chứng cung cấp cho bác sĩ thêm một phương tiện để luôn luôn nẵng 
cao trình độ nghề nghiệp. Y học thực chứng thể hiện một sự hoài nghi trong y 
học, nhưng cũng đồng thời mở ra một cảnh cửa khác. Nếu một thuật chữa trị 
được chứng minh là có hiệu nghiệm, hất kể đó là thuốc Tây hay thuốc Bắc, thì nó 
nên được ứng dụng vào các trường hợp lâm sảng thích hợp. St John Wort chẳng 
hạn, đã được “chứng minh” là có khả năng chống trắầm cảm trong thử nghiệm 
lâm sảng, do đó, theo quan điểm của y học thực chứng, không có lí do gì để gọi 
St Jahn Wort là một thuốc chữa trị nhụ cả. Nếu có băng chứng cho thấy cạo giả 
chữa khỏi cảm lạnh và an toàn thì thuật chữa trị nên được sử dụng. Y học thực 
chứng không phản biệt ”y học chính thống” và ”y học phi chính thống”. 


Thay đổi căn bản mà phong trào y học thực chứng đem lại trong y học là mối 
quan hệ giữa hác sĩ và bệnh nhän. Cho đến nay, mỗi quan hệ này không hình 
đẳng, vì trang đó người quyết định là bác sĩ, và bệnh nhân là người tuân hành 
theo quyết định đó. Y học thực chứng không muốn người bác sĩ nói "Tôi để nghị 
anh nên dùng thuốc này”, hay những phát biểu mang tính khẳng định và làm 
áp lực như “Tôi nghĩ răng”, ˆ Tôi tin rằng”, "Kinh nghiệm tôi, “Đồng nghiệp tôi 
từng”: v.v... Y học thực chứng muốn người bác sĩ phải hạc cách nói “Tôi thấy có 
hãng chứng cho thấy thuốc nảy có hiệu nghiệm X phần trắm trong những người 
mang bệnh như anh. Vậy anh thấy sao?” Sự thay đổi nảy, tuy bể ngoài không có 
gỉ là quả đảng, nhưng về bản chất nỏ dẫn đến sự suy sụp về quyển lực của người 
thấy thuốc, và quyển quyết định được chuyển giao cho bệnh nhần. Đây là một 
khia cạnh má mỗi quan hệ bác sĩ - bệnh nhãn sẽ thay đối trang thời đại y học dựa 
vào thực chứng. Trong thực tế và ở mức độ vĩ mỏ, phong trào y học thực chứng 
ủy quyển cho dữ liệu khoa học, và da đó ủy quyền cho hai phía, bệnh nhãn và 
hác sĩ. Hai bên cùng cỏ lợi. 

Nói một cách khác, trang thế giới y học thực chứng, người bác sĩ đóng vai trỏ 
người hướng dẫn, giới thiệu dữ liệu y học, vả có trách nhiệm trình bày những dữ 
liệu đó trong một hối cảnh liên hệ đến bệnh nhãn. Nhưng quyết định cuối cùng 
là của bệnh nhân: họ có quyển chấp nhận hay từ chối để nghị của bác sĩ. Nếu 
không có các dữ liệu y học trước họ, sự suy xét thuộc quyển sở hữu của người 
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bác sĩ. Nhưng trong y học thực chúng, sự suy xét nảy của bác sĩ được chuyển 
nhượng cho hệnh nhãn. 


Qui trình mà y học thực chứng muốn giới thấy thuốc phải tuần theo là cần 
phải xem xét tất cả bằng chứng khoa học liền quan đến căn bệnh, phải cần nhắc 
lợi và hại của mỗi phương án chữa trị, và đi đến một quyết định tốt nhất cho 
hệnh nhãn. Có thể lấy một vỉ dụ về một bệnh nhân nam, 55 tuổi với bệnh ung 
thư phối và chứng phinh vách động mạch (aneurysm]. Về chữa trị chứng phình 
vách động mạch, bệnh nhân có hai lựa chọn: một là không chữa trị gì cả, vá 
hai là phẫu thuật kẹp lại vách phình (clipping). Nếu chọn phương án thụ động 
(không chữa trị). thì động mạch của bệnh nhãn có nguy cơ bị vũ với xác suất là 
lu mỗi năm, và khi vỡ, xác suất chết là khoảng 83M. Ngoài ra, ví bệnh nhãn có 
ung thư phổi và theo ước đoán của các nhà nghiên cửu, xác suất tử vong vì bệnh 
này là khoảng 7,1% hàng năm. Với các số liệu này, người bác sĩ có thể ước đoán 
răng nếu không giải phẫu, bệnh nhân có thể sống khoảng 12 năm và 7 tháng. 
Mặt khác, nếu chọn phương án phẫu thuật, thi bệnh nhãn phải chấp nhận một 
xác suất tử vong do phẫu thuật gây ra là khoảng 419 (tức là bệnh nhắn có cơ may 
sẵng sút sau giải phẫu khoảng 96%). Và với tỉ lệ tử vong vì ung thư nhối như trên, 
ta có thể đoán rằng nếu bệnh nhân chọn phương án giải nhẫu thì tuổi thọ trung 
bình có thể kéo dải khoảng 15 năm và 7 tháng. Như vậy, phẫu thuật có thể kéo 
dài tuổi thọ khoảng một năm. Nhưng hệnh nhãn cũng cần phải lượng xét xem 
chất lượng của cuộc sống trong một năm đó có xứng đáng để chấp nhận một sựí 
hiểm nguy trong giải phẫu hay không. Đỏ là một quyết định cả nhẫn. 


Cho đến nay, người ta chưa biết bệnh nhân sẽ tiếp nhận y học thực chứng ra 
sao. Can người là những sinh vật xã hội. Chúng ta không muốn phải quyết định 
mọi vẫn để, nhất là phải cẩn đến những tham khảo các dữ liệu khoa học ở thư 
viện hay trên hệ thỗng internet. Nhưng trong cùng lúc, chúng ta không những 
muốn được hảo vệ và chống lại bệnh tật, muốn được chăm sóc khi bị đau ốm, mả 
củn muốn kiểm soát cuộc sống của chính chúng ta. Trong thực tế, mẫu thuẫn vả 
nghịch lí này khó có thể hóa giải ở mức độ cá nhân. 

Giới bác sĩ nói chung cũng không mẫy thích những quan điểm của y học thực 
chứng, bởi vì nó làm thay đổi cái ÿ niệm thế nào là một bác sĩ. Sự hiện điện và 
phát triển của phong tráo y học thực chứng, tự nó, nói lên một sự thật là trang 
thởi đại thông tin, những người hành nghề y khoa không còn là những anh hùng 
hào hiệp như thuở xa xưa. Những thuật chữa trị ngoạn mục cảng ngày cảng ít đi. 
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Penicillin cha bệnh sưng mảng óc, streptomycin cho bệnh lao, Salk vaccine chủ 
hệnh Palio, v.v... chỉ là những viễn đạn huyển diệu (magic bullet} của quả khử. 
Ngày nay, phần lớn chúng ta chết không phải vì bệnh lao, vì bệnh truyền nhiễm, 
mả vì những bệnh như tim mạch, ung thư, những bệnh dù nhiều yếu tổ gây nên, 
và do đó, không dễ mì có được một viên đạn huyển diệu để chữa trị. 


Cảm nhận tuy quan trọng, nhưng cảm nhận không thể là một phương pháp 
để đương đấu với những căn bệnh phức tạp. Những bệnh này đải hỏi nhiều cân 
nhắc cho một cá nhãn. Những cần nhắc này phải dựa vào dữ liệu khoa học, vàn 
cũn số thống kẻ. Nếu một loại thuốc đem đến hiệu nghiệm 28%, và một loại 
thuốc khác cỏ tỉ lệ hiệu nghiệm là 311%, thì loại thuốc thứ hai sẽ được xem là 
tu tiên. Mức độ khác biệt giữa 289 và 31% rất nhỏ để người bác sĩ phải lưu ý, 
nhưng sự khác biệt này có ý nghĩa lửn cho một cộng đẳng. một dân số. Đối với 
một bệnh nhãn, sự khác hiệt sẽ không cỏ ý nghĩa gì, nhưng trang một quốc gia, 
sự khác biệt có thể dẫn đến việc cứu sống cho hàng ngàn người. 


1.4. Sử dụng con số† 


Giới kể tuán hiểu biết được tẩm quan trọng của can số, nhưng giới hác sĩ 
chỉ mới dẫn dẫn hiểu được sức mạnh của con số. Giới bác sĩ ngày nay phải học 
những bái học mả giới kế toán đã từng học hơn một thế kỉ qua. Dù thể nào đi 
nữa, thì y học thực chứng ra đời cũng với một mục địch tiên chỉ của Tổ chức Y tế 
Thể giải về cung cấp sức khỏe cho người dẫn qua định nghĩa đẩy đủ: “Sức khỏe 
là tỉnh trạng sung mãn về thể chất, tỉnh thần, và cả về mặt quan hệ xã hội, chứ 
không chỉ đơn thuần là không có bệnh hoặc không ốm yếu”. 


Dủ củn trong giai đoạn phôi thai và có chống đối, nhưng phong trào và triết 
lí của y học thực chứng đã chỉnh phục đại đa số giới hành nghề y khoa. Lí thuyết 
về y học thực chứng hiện đang được đưa vào chương trình huấn luyện hắc sĩ 
và điểu dưỡng trong tất cả các trưởng y thuộc các đại học ở những nước Tây 
phương, và trong nhiều đại học ở các nước đang phát triển. Các bộ môn chuyên 
khoa trang ngành y đều có chương trình đưa lí thuyết của y học thực chứng vào 
thực tế chữa trị bệnh nhãn. 

Tri thức con người liên tục đặt câu hỏi và đi tìm câu trả lời, và đỏ chỉnh là một 
sản phẩm của chỉnh con người. Y hạc thực chứng, nói cho cùng, thể hiện một 
phát triển tất yếu của quá trình tiến hóa tri thức y khoa. Về lâu về dài, phong trào 
y học thực chứng sẽ góp phân nẵng cao vai trò của ÌÍ trí trong việc quản lí và chữa 
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trị bệnh nhân. Và như thế, phong trào này sẽ đem lại phúc lợi cho chỉnh người 
bệnh và nẵng cao trì thức, khả năng chuyên mỗn của giới y sĩ. 
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BẰNG CHÚNG VÀ VẤN ĐỀ 
PHẢN NGHIÊM TR0NG KHOA HỌC 


nghệ thuật (arts) và nửa khoa học (science). Trang nghiên cứu y học, tôi 

xem phần khoa học là một khía cạnh cốt yếu. Có thể nói, nghiên cửu y 
học là một ứng dụng của mỏ hình khoa học. Dao đó, chúng ta cẩn phải hiểu rõ 
triết lí và phương pháp khoa học của y khoa như thể nào. Trong chương nảy tôi 
sẽ bản qua về vấn để bằng chứng và khải niệm phản nghiệm trong nghiên cứu 
y học. 


VY nhất là thực hành lảm sảng, thưởng được xem là một hộ mỗn nửa 


Hai chữ “Khaa hạc” mà chúng ta dùng cỏ nguồn gốc từ chữ ”scienre” trang 
tiếng Anh (và Phán); chữ sciencc xuất phát tử chữ scientra trong tiếng Latin, cỏ 
nghĩa là tr¡ thức. Do đỏ, hoạt động khoa học bao gốm việc thu thận và phăãn tích 
thông tin từ thế giới chung quanh, rỗi phát triển thành trí thức khoa học dưới 
dạng các định luật vả lí thuyết. Nhưng quả trình thu thận, phần tích và phát triển 
không đơn giản chút náo, và từng là một chủ để được giới triết học tranh luận 
trong nhiễu năm. Có người lỉ giải rằng các lí thuyết khoa học không thể nào 
được chứng minh một cách khẳng định, mà chỉ ở một xác suất nào đó mả thôi. 
Nếu lí giải này đúng thì chúng ta phải giải thích quả trình phát triển của khoa 
học trong 4ÙŨ năm qua như thể nào? Cái gì là cơ sở của trì thức khoa học? Đó là 
vải câu hỏi và cũng là để tài của chương này cùng hai chương kế tiếp, năm trong 
một lĩnh vực mả người ta thưởng gọi là “triết lí khoa học”. 
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2.1. Mật quan điểm phổ thông về khoa học 


Chúng ta quan sắt sự kiện xảy ra hàng ngày. Nhiều quan sát má chúng ta phì 
nhận thưởng xảy ra theo một chu kỉ hoặc hiên tục, huặc nhất định. Hết ngày đến 
đêm; hết mùa xuân, sang mùa hé, qua mùa thu, rối đến mùa đông; lửa luôn luỗn 
nóng; nước đả luôn luận lạnh; v.v... Những chu kì hay quan sát như thế có thể 
dùng để phát triển thành những qui luật khoa học. 


Do đả, nói đến hai chữ “khoa học” chúng ta nghĩ ngay đến cầu phát biểu 
“Khoa hục dược đúc kết từ dự liệu thật” (hay nói bằng tiếng Anh, “Sclence is 
derived from the facts”) mà chúng ta đã được dạy từ khi mới chặp chững làm 
quen với khoa học. Nhưng nếu chịu khó phản tích câu phát biểu nảy, chúng ta sẽ 
thấy nó có vải điểu không ổn, dù cũng không phải là quả sai lắm. 


Khoa học đáng một vai trỏ đặc biệt vì nó dựa vào dữ liệu thật, và dữ liệu nhản 
ảnh thể giới chung quanh mả chúng ta có thể phí nhận được một cách khách 
quan, qua các giác quan. Khoa học, do đó, dựa vào những gì chúng ta nhìn thấy, 
nghe được, và sử được, hơn là dựa vào các ý kiến cá nhắn, hay suy luận theo 
tưởng tượng. Nếu quan sát thế giới một cách khách quan và cẩn thận, thì dữ liệu 
thật thu nhận hãng quan sắt được xem là một cơ sử vững chải, an toàn, và khách 
quan cho khoa học. Nếu qua lí giải, những đữ liệu thật này được biến thành qui 
luật và lí thuyết, thi lúc đỏ chúng ta có một trí thức khoa học. 


Những nhận xét trên đây là rưởng cột của một câu chuyện quen thuộc về 
khoa học được nhiễu triết gia khoa học (như ]. J. Davies, H. D. Anthony) để cập 
đến. Quan điểm của Änthony là trí thức khoa học phải dựa vào dữ liệu thật, và 
những dữ liệu nảy phải được thu thập bằng quan sắt, thí nghiệm. Có lễ quan 
điểm nảy xuất phát tử trước thể kỉ 17, khi mà dữ liệu thật được nhìn nhận một 
cách nghiêm túc như là nền tảng của tri thức khoa học. Trước thể kỉ 17 ở Âu 
châu, thay vì dựa vào dữ liệu thật, người ta dựa vào những phát hiểu của các nhá 
triết học có ảnh hưởng lớn như Äristotle và Kinh thánh của Ki-tô giáo. Thời 
điểm mà Galileo thách thức uy quyển của Kinh thánh thưởng được xem là thời 
điểm phát sinh của khoa học hiện đại. 

Liên quan đến quan điểm “khoa học được đúc kết tử dữ liệu thật, có hai 
trưởng phải tư tưởng rất phổ biển trong thời gian trước đảy, đỏ là trưởng phải 
Thực chững chủ nghĩa (Positivisam) và Kinh nghiệm chủ nghĩa (Empiricism). 
Những người theo trưởng phải kinh nghiệm chủ nghĩa vào thể kỉ 17 và 1 như 
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John Lacke, George Berkeley, và David Hume cho răng trì thức khoa học nên 
được phát triển từ những tư tiởng đã được gieo cấy vào trí óc và cảm nhận. Còn 
những người theo trường phái thực chứng chủ nghĩa thì chịu ảnh hưởng tâm lí 
¡t hơn, tuy quan điểm của họ cũng chẳng khác xa với trường phải kinh nghiệm 
chủ nghĩa: đó là trí thức khoa học nên dựa vào dữ liệu thật và kinh nghiệm. Vàn 
thập niên 1920, ở Vienna (Áo), một số nhà triết học theo thực chứng chủ nghĩa 
ở đây phát triển một học thuyết mới có tên mả tôi tạm dịch là Chủ nghĩa Thực 
chưng logic (Logical positivism). Họ chủ trọng vào hình thức logic của mỗi quan 
hệ giữa trí thức khoa học và đữ liệu thật. 


Có hai vẫn để trong quan điểm trí thức khoa học được đúc kết từ dữ liệu thật. 
Vấn để thứ nhất là bản chất của những dữ liệu thật và cách thức mả các nhà khoa 
học tiếp nhận chúng. Vấn để thú hai là các đữ liệu thật được xử lí như thế nào để 
đi đến những qui luật và lỉ thuyết làm nền tảng cho trï thức khoa học. 


2.2. Vấn để của kinh nghiệm và thị giác 


Chúng ta nhìn sự kiện bằng con mắt. Hai cơ phận quan trọng nhất của con 
mắt là thủy tình thể (hay nói nêm na là thấu kinh) và vũng mạc. Võng mạc đảng 
vai trò như là một màn ảnh, và qua màn ảnh nảy, hình ảnh của các vật thể được 
hinh thành bảng thấu kinh. Sau khi hình thành một hình ảnh, dây thần kinh thị 
giác truyển hình ảnh cho hộ não. Hình ảnh thu nhận bằng hộ não còn kẽm theo 
một số thông tin mà chúng ta dùng chúng như là dữ liệu. Nói một cách ngắn 
gọn, cơ cầu vận hành của con mắt cũng miỗng như một cái máy ảnh, nhưng cải 
khác hiệt lớn nhất giữa máy ảnh và con mắt là hình ảnh được thu nhận. 


Qua cách thu nhận dữ liệu bằng thị mác như trên, chúng ta thấy can người 
có thể truy cặp tri thức, dù trực tiếp hay gián tiếp, từ các dữ liệu thật của thế giới 
chung quanh như khi chúng được thu nhận qua hộ não và hành động nhìn. Một 
điểm khác cẩn nói ở đây là khi hai người bình thường quan sát một vật thể, hay 
một sự kiện, trong một mỗi trưởng, cùng một không gian vả thời gian, họ có thể 
“nhin” một vặt thể như nhau, bởi vì cơ chế vận hãnh của mắt và bộ não của hai 
người mỗng nhau. 

Thể thi, theo một quan điểm đơn giản và phố thông nhất, là thể giới chung 
quanh xuất hiện trước thị giác của chúng ta, và chúng ta chỉ cẩn trực tiến ghi 
nhận chúng. Chúng ta có thể thấy cây bút trên bản, cải đèn máu xanh, chiếc ö tô 
đang chạy... qua con mắt. Tuy nhiên, có nhiều bằng chứng cho thấy “Thấy vậy 
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mả không phải vậy” Hai người bình thưởng, cũng nhìn cùng một vật thể, tử một 
địa điểm, trong một hoàn cảnh, chưa chắc có cùng phi nhận. 

Chẳng hạn như nhìn hình bản, có 
lẽ phẩn lớn chúng ta đếu thấy đó là 
một cầu thang. Nhưng một thi nghiệm 
trong một hộ lạc bên Phi châu, nơi mả 
văn hóa của hộ lạc này không từng tiến 
xúc với hình ảnh ba chiểu, họ không 
ghi nhận đỏ là một cẩu thang. | 

Tương tự. nếu cho các sinh viên y khoa (chưa từng được học về quang tuyển 
X) nhìn vào những tấm phim quang tuyển X, họ sẽ không thấy ý nghĩa gì của 
những đường nét trung phim. Nhưng nếu họ đã được huấn luyện cỏ hệ thống, họ 
sẽ nhận ra ngay những đặc tính quan trọng và ý nghĩa lãm sàng trong tấm phim. 


Mỏi cách khác, cải mà chúng ta ghí nhận được có thể chịu ảnh hưởng của 
kinh nghiệm và văn hỏa mà chúng ta trải qua. Do đó, quan điểm “Khoa học 
được đúc kết tử dữ liệu thật” có vấn để. Hưn thế nữa, một khó khăn khác xuất 
phát tử sự phán xét của chúng ta về sự thật còn tùy thuộc vào những trí thức 
chúng ta đã có, và do đỏ, đữ liệu thật có thể hị “bóp méo” vì những giả định hay 
định kiến đã có sản trong tâm trí của chúng ta. 


2.3. Vài điều về “đữ liệu thật” 


Thể thì dữ liệu thật là gi? Trang ngôn ngữ hàng ngày, ` dữ liệu thật” là cụm tử 
có nghĩa không rõ ràng. "Dữ liệu thật, hay “fact” trong tiếng Anh, là một khái 
niệm để hị hiểu lắm. Nhiễu nhà khoa học thưởng để cận đến những phát hiểu 
hay qui luật phổ quát như “Lửa luỗn luỗn nóng” là những dữ liệu thật. Nhưng 
dữ liệu thật không phải là những phát biểu như thế, mà là chữ dùng để chỉ đến 
một sự kiện đưn giản và cụ thể. “Sáng nay tôi thấy một con chim tỉng máu đen” 
là một dữ liệu thật. 

Dữ liệu thật củn có thể để cập đến một phát biểu, một trạng thái, sự việc, hay 
một vật thể, mà phát biểu đỏ để cập đến. Chẳng hạn như trong câu nói ” Trên mặt 
trắng có núi và hầm hổ, núi và hấm hố là đữ liệu thật. Hay nói một cách khác 
"Trên mặt trắng có núi và hầm hổ” là một dữ liệu thật. Khi nỏi rằng “Khoa học 
dựa vào dữ liệu thật” là nói theo nghĩa thứ hai này. Trí thức về mặt trăng không 
phải dựa vào, hay đúc kết tử nủi và hầm hỗ, mà từ nhát biểu về núi và hấm hỗ. 
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Phân hiệt dữ liệu thật là một chuyện, nhưng hiểu và nhân biệt những phát 
hiểu này từ cảm nhận là một chuyện khác. Chẳng hạn như trường hợp Charles 
Darwin ghi chép những loài vật mới lạ trong chuyển hải hành đài ngày của ông: 
nếu ông chỉ dừng lại ở những phi chép đó thì ông cũng chẳng đóng góp gì cho 
khoa học vả trí thức khoa học; nhưng khi ũng hệ thống hóa, mỗ tả những cải 
mới lạ này, và đúc kết thành qui luật, thì ông đã có cổng hiển lớn cho khoa học. 

Câu phát biểu "Khoa học được đúc kết tử dữ liệu thật” có phải hàm ý cho 
răng đữ liệu thật cẩn phải được thu thập trước khi hình thành một trí thức khoa 
học? Như đã chứng minh trên đây, kinh nghiệm và trí thức cá nhản có thể ảnh 
hưởng đến dữ liệu mả giác quan của chúng ta thu nhận được. Những quan sắt 
hao hàm những khuôn khổ của ý niệm. Do đó, xây dựng lí thuyết sau khi đã có 
dữ kiện thật là một điểu không hoàn toàn khách quan. 


Để những quan sát có khả năng cống hiến vào trí thức y học, chúng ta, người 
quan sắt, phải có hiểu biết về y học. Sự truy tìm các dữ liệu thật cỏ ý nghĩa cần 
phải dựa vào những tri thức hiện tại làm kim chỉ nam, để biết những gì má 
chúng ta đang quan sát, đang thu thận là “có ý nghĩa” hay không. Với một công 
cụ y học, ai cũng cỏ thể do độ mũ trong máu, mặt độ chất khoảng trong xương, 
nhưng không nhải ai cũng hiết giá trị của những đo lưỡng này có ý nghĩa gi đến 
sức khỏe của bệnh nhân. Da đá, chúng ta phải hỏ đi cải yêu cẩu răng dữ liệu thật 
phải có trước khi phát triển các định luật vả lí thuyết làm nền tảng cho khoa học. 


2.4. Phương nháp qui nạp và logic trẻ can 

Dữ liệu thật vẫn cần thiết cho việc nhát triển các trí thức khoa học. Trong quá 
trinh phát triển tri thức, chúng ta phải vận dụng đến một vải logic, trong đỏ có 
loại loøic trẻ cạn. Ví dụ sau đây cho thấy một suy luận hoàn toàn đủ, hay nói then 
ngũn ngữ triết học, là logic, là hợp lí: 

1. Tất cả các sách về y học đếu nhằm chắn; 

3. Cuốn sách này là sách về y học; 

3. Cuốn sách này nhằm chắn. 

Trong lí giải này, (1) và (2) là tiến để (hay giả thuyết), và (3) là kết luận. Câu 
(3) không thể não sai nếu (1} và (2) là dữ liệu thật. Mếu tiền để đúng thì kết luận 
cũng hợp lí, hay đúng. 


Nhưng nếu chúng ta thay đổi một chút cải tiền để, chúng ta sẽ có một lỉ giải 
không đẩy đủ: 


1. Nhiều sách về y học là nhằm chắn; 

2. Cuốn sách này là sách về y học; 

3. Cuốn sách này nhàm chắn. 

Trong vỉ dụ nảy, nếu (1) và (2) đúng thì (3) không thể đúng được, hởi vi cuỗn 
sách nảy có thể thuộc vào thiểu số những sách khoa học hấp dẫn. 

Một lí giải có thể hoàn toàn logic ngay cả khi tiến để sai. Ví dụ: 

1. Tất cả chó có 5 chân; 

2. TiH là con chả của tôi; 

3. Tin có 5 chãn. 

Đây là một điễn giải hoàn toàn hợp lí. Nếu (1) và (2) đúng thì (3) cũng đúng. 
Nhưng trong vỉ dụ này phát biểu (1) sai, cho nên kết luận (3) cũng sai. Nhưng cải 


sai đó không ảnh hưởng gì đến cái đúng của phương pháp suy luận (hởi vì phát 
hiểu (1) vẫn là một dữ liệu)! 


2.5. Định luật khoa học có thể đúc kết từ dữ liệu thật không? 


Qua logic trẻ con trên đây, chúng ta có thể chứng mình răng trí thức khoa 
học không thể đúc kết từ dữ liện, nếu “đúc kết” ở đây có nghĩa là diễn giải một 
cách logic. Có thể lấy một vài vỉ dụ để minh họa cho phát hiểu quan trọng này. 
Những định luật đơn giản như “Kim loại bị giãn ra khi được nung nóng”, "Nước 
đá luôn luôn lạnh” được các nhà triết lí khoa học gợi là những qui luật phổ quát. 
Nói đến “phổ quát” là hàm ý nói rằng những qui luật như thế đếu đúng trang 
thực tế, đ mọi nơi, trong mọi tỉnh huống. Vỉ dụ, phát biểu “Khi nói nước đá luôn 
luôn lạnh” cho biết tất cả nước đá - ở bất cứ nơi nào trên thể giới và bất cứ lúc 
nào (hôm nay, ngày mai hay trong quả khử) - đếu lạnh. 


Nhưng không phải qui luật khaa học nào cũng mang tỉnh phổ quát như thế. 
Thay vì nói “ Tất cả trải tán chín đếu đỏ, người ta có thể nói ” Táo chín thưởng cỏ 
mảu để” Đỏ là một qui luật thống kẻ. Cả hai qui luật, phổ quát và thống kẻ, đếu 
cần thiết trang khoa học. Qui luật nhổ quát đơn giản hơn, còn qui luật thống kẻ 
đổi hỏi một sự phân tích phức tạp hơn. Trí thức khoa học nhiều khi liên quan 
đến những nhát biểu thống kẻ như thể. 
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Nhưng vẫn để sẽ khác khi chúng ta tiếp thu những phát biểu làm nến tẳảng 
cho dữ liệu thật và những dữ liệu thật này làm cơ sử cho các định luật khoa học. 
Những dữ liệu thật được quan sát hay thu nhận từ thí nghiệm là những dữ liệu 
cụ thể về một tỉnh trạng, một sự việc, ử một thời điểm nảo đỏ. Đây là những đữ 
liệu mà các nhà triết lí khoa học gọi là “phát biểu đơn” (singular statement). Ví 
dụ như những phát biểu “Chiếu dải của cọạng dây đồng sẽ tăng nếu sợi dây được 
nung nóng” Giả dụ chúng ta có trong tay nhiều dữ liệu thật như thể để làm cơ sở 
cho việc phát triển tri thức khoa học, chúng ta sẽ kết luận như thể nào? 

1. Bệnh nhân Á uống thuốc X và hết bệnh vào thời điểm í ; 

2. Bệnh nhân B uống thuốc % và hết bệnh vào thời điểm ¡ ; 


3. Bệnh nhân Ö uống thuốc X và hết bệnh vào thời điểm † ; 


n. Bệnh nhân N uống thuốc X và hết bệnh vào thời điểm f . 

Kết luận: Tất cả các bệnh nhân sẽ hết bệnh khi uống thuốc X. 

Tuy nhiên, kết luận nảy không hợp lí, bởi vì nó thiếu đặc điểm cơ bản của 
một lí giải như thể. Dù những phát biểu tiển để là đúng, nhưng kết luận không 
phải lúc nào cũng đúng. Dù cho nhiễu quan sắt (n lần) cho thấy kim loại giãn ra 
khi được nung nóng, nhưng đứng trên phương diện logic, chúng ta vẫn chưa thể 
kết luận phản ứng này xảy ra cho tất cả kim loại. 

Vấn để quan trọng được đặt ra, do đỏ, là trong trưởng hựp nào định luật khoa 
học đúc kết từ dữ liệu được xem là hựp li Câu trả lời đầu tiễn là một qui nạp 
chỉ hợp lí khi các dữ liệu thật có thể hợp li, và nếu những điểu kiện sau đây được 
đáp ứng: 

1. Số lần quan sắt (n) phải lớn; 

3. Các quan sát phải được lặp đi lặp lại nhiễu lẳn trong nhiều mỗi trường 
khác nhau; 

3. Không một quan sát nào hay phát biểu nàn mẫu thuẫn với lỉ thuyết. 

Điểu kiện 1 tất nhiên là cẩn thiết, bởi vì rõ ràng chúng ta không thể có một 
kết luận cho mọi bệnh nhân nếu sẽ lần thử nghiệm/quan sát chỉ rút ra tử một vải 
người. Do đỏ, một số lượng quan sát lớn và độc lập với nhau là điểu kiện rất cẩn 
thiết để đi đến một khải quát hóa cho vẫn để. 
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Một cách làm tăng số lấn quan sắt là chỉ cho một bệnh nhân uống thuốc 
nhiễu lần, nhưng cách làm nảy dĩ nhiên là không chấn nhận được vì câu kết luận 
là “Tất cả bệnh nhãn.... Thành ra, điểu kiện 2 cẩn phải được đản ứng, tức là thử 
nghiệm không những trong nhiều đối tượng mả còn phải được thực hiện trong 
nhiễu hối cảnh khác nhau. Nếu điểu kiện này được đáp ứng. chúng ta mới có thể 
phát biểu về tính tin cậy của định luật. 


Nhưng nếu một hệnh nhãn nào đỏ không hết bệnh khi uống thuốc X, thi việc 
khái quát hóa (hay kết luận) sẽ trở nên thiếu cơ sử. Do đó, điểu kiện 3 cũng cẩn 
phải được đáp ứng. 


Những li giải trên đây có thể tóm lược bằng một phát biểu về nguyễn lỉ của 
qui nạp như sau: Nếu hiện tượng Â được quan sắt nhiều lấn trung nhiều mỗi 
rung khác nhau ch. thấy A có đặc tỉnh B; dù đó, tất cả A đều cú đắc tính B. 


Nhưng nguyên lỉ này cũng không phải là không có vẫn để. Điều kiện Ì yêu 
cầu quan sát cẩn phải lặp đi lặp lại nhiễu lần, nhưng “nhiễu lần” là bao nhiễu? 
Một trăm lần, một ngàn lẳn, hay hơn nữa có thể xem là “nhiều lần” hay không? 
Dù cho chúng ta có câu trả lời với một con số nào đó, thì con số đó cũng chỉ là 
tủy tiện mả thôi, vì có ai biết được bao nhiêu lần. Nhưng vấn để không chỉ dừng 
ử đỏ, mả trong nhiễu trưởng hợp, số lần quan sát hay thử nghiệm không thể thực 
hiện được. Chẳng hạn như phong trào quẩn chúng phản đối chiến tranh hạt 
nhắn sau khi Mĩ thả bam nguyễn tử xuống thành phố Hiroshima vào cuối Thể 
chiến thử II. Phản ng của quẩn chúng xuất phát từ sự hủy diệt mỗi trưởng và 
tàn sát quá nhiều mạng người. Cï đây, chúng ta không đổi hỏi phải có thêm một 
cuộc chiến với một trải bom khác để biết được phản ứng của quần chúng! Tương 
tự, không một nhà khoa học hình thưởng nào đôi hỏi một người phải đặt bàn tay 
trước ngọn lửa nhiều lần để xem lửa có làm cháy bàn tay hay không. 


Biểu kiện thứ 2 cũng có vấn để nghiêm trọng, vì thế nào là, và làm sao đo 
được sự biến thiên của câu phát biểu “nhiễu mỗi trưởng khác nhau”? Chúng ta 
củ cần thử nhiễu dạng kim loại khác nhau? với nhiễu sức ép khác nhau? khác giở 
trong ngày? Cầu trả lời có thể là “cẩn” cho câu hỏi thử nhất và thứ hai, nhưng cả 
thể là “không” cho cầu hỏi thứ ba. Nhưng câu trả lời đó được dựa trên cơ sở nào? 
Câu hỏi nảy quan trọng, bởi vì nếu nguại trừ trường hựp chúng ta có thể trả lời 
và loại trữ tất cả những thay đổi về mỗi trường thử nghiệm (như là kích thước 
phòng thí nghiệm, màu da của chân tưởng, tâm tính người làm thí nghiệm... ) 
thi kết quả mới có thể đảng tin cậy được. Nhưng dựa vào cơ sở nào để chúng ta 
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cho räng những mỗi trưởng trên là không cần thiết? Cầu trả lời đơn giản nhất là 
chúng ta dựa vào lương năng hình đản (camman sense), dựa vào trí thức và kinh 
nghiệm cả nhần, để phân biệt mỗi trưởng nào có ảnh hưởng, và mỗi trường nào 
không củ ảnh hưởng. đến kết quả thử nghiệm. Tức là, chúng ta vẫn phải dựa vào 
tri thức cá nhân để phán xét cái gì là cần thiết và cái gì là không cẩn thiết trong 
việc điểu tra sự vật. Và, như thể, nó đi ngược lại với nguyên lỉ qui nạp là tri thức 
khoa học chỉ nên được đúc kết từ dữ liệu thật băng phương pháp qui nạp. 


Văn để thử hai của phương pháp qui nạp là các định luật khoa học thưởng 
mang tính chỉnh xác của toản học. Chẳng hạn như định luật hấp dẫn (gravitatian 
law} phát biểu rằng lực miữa hai khối lượng là tỉ lệ của tích số trọng lượng của hai 
khối lượng chia cho binh nhương của khoảng cách giữa hai khối lượng. Nhưng 
trong tất cả các phương pháp đo lường về khoảng cách hay trọng lượng đếu 
không trảnh khỏi một mức độ sai sót ngẫu nhiền hay sai sót có hệ thống. Chỉnh 
vi thể mả các nhà khoa học thường viết x + dxv (với dx là độ sai số đo lưỡng). Dao 
đó, các định luật khoa học không thể nào đúc kết (bằng phương pháp qui nạp} 
từ các dữ liệu thiểu chỉnh xác. 


Một vấn để khác của nhương pháp qui nạp nằm ngay trong lập luận của qui 
nạp. Tỉnh logic của nguyên lỉ qui nạp được xác định như thể nào? Những người 
theo phương phán qui nạp cho răng phương pháp này hợp lí vì nó mang tính 
logic. Nhưng cũng có người cho rằng sự hợp lí của phương pháp qui nạp là do 
kinh nghiệm. Nhưng như trình bảy trên đây, phương pháp qui nạn chưa chắc 
dẫn đến một suy luận logic. Và ngay cả kinh nghiệm thi cầu hỏi cẩn đặt ra là kinh 
nghiệm bao nhiêu lấn. Thật khó mà cỏ cầu trả lửi dứt khoát cha cầu hỏi này. 

Do đỏ, nói tóm lại, trí thức khoa học về thể giới võ hình (không quan sắt 
được) không phải lúc nào cũng có thể đúc kết từ đữ liệu thật, và cũng không thể 
nào xác minh bảng những lập luận theo phương pháp qui nạp được. Trong y 
học, có rất nhiều đặc tính bệnh trạng chúng ta không thể nào quan sắt trực tiếp 
được, da đó phương phảp qui nạp cũng không hẳn áp dụng cho mọi tình huống. 


2.6. Phản nghiệm trung y học 


Như đã giải thích trên, phương pháp qui nạp có vấn để, và mỏ hình khoa 
học của Francis Bacon (khoa học được đúc kết tử dữ liệu thật} cũng có vấn để. 
Vào thập niên 1920, ở Vienna có một trường phải triết học thường được gọi là 
“Vienna Circle”" (Nhỏm Vienna), mả một trang những người nổi tiếng nhất là 
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Rudolph Carnap. Nhỏm này phát triển thuyết Thuực chứng lagic chủ nghĩa (logical 
positivism). Nhóm nảy chủ trương rằng một giả thuyết khoa học, hay một phát 
hiểu, chỉ có ý nghĩa nếu nỏ được xác mình hãng dữ liệu thật. Nói một cách khác, 
nếu một phát biểu thiểu hãng chứng thì phát biểu đá hoàn toàn vỗ nghĩa. 


Cũng trung thời mian nảy và ở Vienna, một nhà triết học nổi tiếng khác, Karl 
Popper"", không theo Nhóm Vienna, để xuất một thuyết khác có tên tiếng Anh 
là EalsifiraHamism mà tôi tạm dịch là thuyết “Phản nghiệm”. Hai nhà triết học 
danh tiếng này, Karl Popper và Rudolph Carnap, và đồng mỗn của họ từng tranh 
luận với nhau một cách dai dẳng, kéo dài cho đến thập niên 1960. Theo Popper, 
không ai có thể chứng mình một giả thuyết khoa học bằng cách chỉ đơn giản thu 
thập thêm dữ liệu. 


Nói một cách đơn giản, theo thuyết phản nghiệm, một giả thuyết (hay li 
thuyết) được xem là mang khoa học tỉnh, giả thuyết đá phải đáp ứng một điểu 
kiện: thuyết đỏ phải có khả nắng phản biện. Nói một cách khác, một giả thuyết 
được gọi là “giả thuyết khoa học” nếu một kết quả của thử nghiệm (hay quan sát) 
không nhất quản với giả thuyết đó. Ví dụ như nếu cỏ người phát biểu rằng “"Tất 
cả chím ng đếu là màu đen, thì địa vị khoa học của phát biểu đỏ chỉ được công 
nhận nếu nỏ có thể bác bỏ bằng một quan sát “Một con chím tng không phải 
mảu đen xuất hiện ở địa điểm x và thời điểm £. Nếu tiến để là “Một cạn chìm 
tỉng, không phải máu đen, xuất hiện ử địa điểm x, và thời điểm £} thì cầu kết luận 
“Không nhải con chim tỉng nào cũng màu đen” là một suy luận logic. 


Đỏ là một quan điểm khả bình thưởng. Thực vậy. nếu chúng ta có thể xác 
định được răng một vặt thể 1ñ kg và một vật thể 1 kg rơi [trang cùng một không 
gian] có cùng tốc độ, thì ai cũng có thể nói cái định luật cho răng “tốc độ rơi của 
vật thể tùy thuộc vào trọng lượng của vật thể đá” là sai lầm. Tức là, chỉ cần một 
quan sát duy nhất cũng có thể phản nghiệm một lỉ thuyết, bất kể lí thuyết đỏ phổ 
hiển như thế nào. 


1. Karl Popper (28/77/1902 - 7/9/1994) người Áo, ông được xem là môi triết gia kha học hàng đấm của thế kỉ 
2. Tác nhẩm chính đầu tiên, L.aeïk der Ersrhung (The [ngir dƒ Research), xuất bản nãm 1934, dược cơi như 
là mắt tác nhãm kinh điển của phép phản nghiểm, môi triững phái piuổ hiển của chủ ngẫĩa thực chúng 
Lueic (loeical maaitiyism), rõa tiếp cận đến khoa lục được gơi là "chủ nghĩa nhân nghiêm” (falsiiicatinnisan}. 
miä cử sử đưa trên phép phê phản hiểm là xác mindi Từ đả, ông đã được thỉnh giảng đ Ảnh quốc, mã san này 
trở thành quê hương thứ hai của ông. T lí thuyết nhảm nghiệm của ông mã sau này người ta có thể nhân 
định sự khác liệt siữa khoa hạc với nguy kiuna bọc. Ông nhận được rất nhiễu giải thưởng vĩnh dự của cả 
Hiệp hội Khoa học Chính trị Haa Kỳ, Viện Hàn lâm Anh v.v... Ủng đã được Nữ hoàng Elisaheth IÍ nhang 
Iriđc hiệp sĩ năm 1965, và Huần chương I?anh dự năm 1982. Ngnải tác phẩm nỗi tiếng nêu trên, ông đã 
rũng hiến cha khiua húc thế giđi nhiễu tắc phẩm vũ giả vẺ triết hịc khoa húc. 


-130- 


hffps://tieulun.hopto.org 


2.7. Khả năng phản nghiệm như là một tiêu chuẩn cho lí thuyết 


Người theo chủ nghĩa phản nghiệm nhìn khoa học như lả tập hợp các giả 
thuyết được để xuất nhằm mỏ tả và giải thích các hiện tượng thế giới. Tuy nhiên, 
không phải mả thuyết nào cũng có thể làm việc nảy. Một điểu kiện cực kì quan 
trọng là một giả thuyết, hay một hệ thống giả thuyết, phải đáp ứng để được công 
nhận là một lí thuyết khoa học: đỏ là điểu kiện phản nghiệm. Để được địa vị 
khoa học, một giả thuyết phải có khả năng phản nghiệm được. Chúng ta có thể 
lấy ra một vải phát biểu để minh họa cho quan điểm trên đây: 


1. Trời không ban giữ mưa vào ngày thử Tư; 
32. Tất cả bệnh nhãn có mật độ xương thấp đểu bị gãy xương; 


3. Các vật thể nặng như đả và mạch, khi được thả rơi tự do, sẽ rơi ngay xuống 
phía dưới mặt đất; 


4. Khi một tia sáng nhản xạ tử một tấm gương, góc tới (angle of incidence) 
hãng gác phản xạ. 

Phát biểu 1 có thể phản nghiệm được, vì chúng ta có thể quan sát một đợt mưa 
vào ngày thứ Tư (bất cứ trong tháng nào và ở đầu). Phát biểu 2 cũng có thể phản 
nghiệm được, bởi vì chúng ta có thể quan sắt nhiều bệnh nhắn với mặt độ xưng 
thấn và xem cỏ bao nhiễu người bị gãy xương. Phát biểu 3 và 4 có thể là sự thật mả 
chúng ta biết được, nhưng cũng có thể phản nghiệm được. Một viên nạch có thể 
phóng ngược lên trời. Một tia sáng phản chiếu trên một tấm gương có thể hình 
thành 90 độ so với mặt nương, mà không nhất thiết phải bằng góc tới. 

Khả năng phản nghiệm là sự kết nỗi quan trọng không chỉ với vẫn để “cỏ ý 
nghĩa” mả còn với một phương pháp khoa học. Popper nhấn mạnh rằng khả 
năng phản nghiệm là một đặc điểm không thể thiểu được trong một nghiên cứu 
khoa học. Nếu một giả thuyết được đưa ra để giải thích một hiện tượng thực 
nghiệm nảo đó mả không có thể “bác bỏ được” thì thuyết đó không có tỉnh khoa 
học, và chẳng có ý nghĩa gì nữa để mã phải tiến hành kiểm chứng cả. Chẳng hạn 
như những nhát hiểu sau đây: 

5, Trời hoặc mưa, hoặc không mưa; 


6. Tất cả các điểm trên một vòng tròn Euclid đếu có cùng khoảng cách với 
trung tắm của vòng trủn; 


7. May mắn là một điều khả dĩ trong các suy luận liên quan đến thể thao. 
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thi không thể phản nghiệm được (và do đó chúng không thể là một giả thuyết 
khoa học được). Trong phát biểu 5, không ai có thể bác bỏ vì nó chẳng có gì để 
bác bải Phát biểu 6 thì hoàn toàn đúng theo định nghĩa của vòng tròn Euclid. 
Phát biểu 7 là một thủ đoạn của giới hỏi toán, và cũng không thể phản nghiệm 
được vì cả hai tình huống (thẳng và thua) đều có thể xảy ra. 


Một lí thuyết khoa học phải cho chúng ta một vải thông tín về sự vận hành 
của thế giới. Chẳng hạn như câu nói "Những người độc thản đểu không có vợ” 
chẳng cho chúng ta một thông tin nào cả. Dao đá, khác với các phát biểu 1, 2, 3 
và 4, tất cả các phát biểu 5, 6, và 7 không cho chúng ta một trí thức gì về thế giới 
cũng như không thể xem là các giả thuyết khoa học được. Tương tự, những niềm 
tin như cỏ một Thượng để bao dung đang che chử cho chúng ta, hay các thiên tai 
xảy ra là do “Trời” trừng phạt chúng ta, hay thú vật được sinh ra để làm những 
chức năng mả Thượng để giao phó, v.v... là những phát hiểu mang tỉnh “tùy cơ 
ứng biển” (tức là muốn giải thích sao cũng được), và nhí khoa học, bởi vì chúng 
không cha chúng ta một thông tin hữu ích nào. Do đỏ, một lí thuyết khoa học 
phải hàm chứa thông tin, phải có khả năng phản nghiệm. Khả nắng phản biện 
cảng cao, miả thuyết càng khoa học. Một giả thuyết cảng táo bạo cảng tốt. 


Trong khoa học, chúng ta học hỏi từ sai lắm. Y khoa cũng thể: nhát triển của 
y học cũng một phần lớn là do... sai lầm. Có thể xác định nghiên cứu y học như 
là một qui trình thử nghiệm giả thuyết. Tôi tôm lược qui trình này như sau: 


Bước 1. Khởi đấu, nhà nghiên cứu cẩn phải định nghĩa một giả thuyết 
đảo hay giả thuyết vô hiệu (nuÏÍ hypothesis), tức là một giả thuyết ngược lại 
với những gỉ mả nhả nghiên cứu tin là sự thật. Thí dụ trong một nghiên cứu 
lãm sảng, gốm hai nhóm bệnh nhân: một nhóm được điểu trị bằng thuốc À, và 
một nhóm được điểu trị bằng nÌacebo, nhà nghiên cửu có thể phát hiểu một giả 
thuyết đảo rằng sự hiệu nghiệm thuốc À tương đương với sự hiệu nghiệm của 
placehbo (có nghĩa là thuốc À không có tác dụng như mong muốn). 

Bước 2. Nhà nghiên cứu cần phải định nghĩa một giả thuyết nhụ (alternative 
hypothesis), tức là một giả thuyết mà nhà nghiên cứu nghỉ là sự thật, và điểu cẩn 
được "chứng minh” bằng dữ liệu. Chẳng hạn như trong vỉ dụ trên đây, nhà nghiên 
cứu có thể phát biểu giả thuyết phụ rằng thuốc À có hiệu nghiệm can hơn nÌaceho. 

Bước 3. Sau khi đã thu thập đẩy đủ những đữ liệu liên quan, nhà nghiên 
cứu dùng một hay nhiều phương pháp thống kẻ để kiểm tra xem trong hai giả 


-1- 


hffps://tieulun.hopto.org 


thuyết trên, giả thuyết nào được xem là khả dĩ. Cách kiểm tra này được tiến hành 
để trả lời cầu hỏi: nếu giả thuyết và hiệu đúng, thì xác suất mà những dữ liệu thu 
thập được phù hựp với giả thuyết vỗ hiệu là bao nhiêu. Giá trị của xác suất này 
thường được để cặp đến trong các bảo cáo khoa học bằng kí hiệu ˆP value" Điểu 
cần chủ ý ở đây là nhà nghiên cứu không thử nghiệm giả thuyết khác, chỉ thử 
nghiệm giả thuyết đảo mà thôi. 

Bước 4. Quyết định chấn nhận hay loại bỏ giả thuyết đảo, bằng cách dựa 
vào giá trị xác suất trong bước thứ ba. Chẳng hạn như theo truyền thống lựa 
chọn trong một nghiên cứu y học, nếu giá trị xác suất nhỏ hơn 5% thì nhà nghiên 
cửu sản sảng bác hỏ giả thuyết đảo: sự hiệu nghiệm của thuốc Ä khác với sự hiệu 
nghiệm của placehbo. Tuy nhiên, nếu giả trị xác suất cao hơn 5%, thì nhà nghiên 
cứu chỉ có thể phát biểu răng chưa có bằng chứng đấy đủ để bác bỏ giả thuyết 
đảo, và điểu này không có nghĩa rằng giả thuyết đảo là đúng, là sự thật. Nói một 
cách khác, thiếu bäng chứng không có nghĩa là không có bằng chứng. 

Bước 5. Nếu giả thuyết đảo bị bác bỏ, thì nhà nghiên cứu mặc nhiên thừa 
nhận giả thuyết phụ. Nhưng vấn để khởi đi từ đây, bởi vì có nhiều giả thuyết 
phụ khác nhau. Chẳng hạn như so sảnh với giả thuyết phụ ban đấu (A khác với 
placebo), nhà nghiên cứu có thể đặt ra nhiều giả thuyết phụ khác nhau như sự 
hiệu nghiệm của thuốc À cao hưn placeho 5%, 10% hay nói chung X®⁄ú. Nói tắm 
lại, một khi nhà nghiên cứu bắc hỏ giả thuyết đảo, thì giả thuyết phụ được mặc 
nhiên công nhận, nhưng nhà nghiên cứu không thể xác định giả thuyết phụ nào 
là đúng với sự thật. 

Trong khoa học thực nghiệm (như y khoa, sinh học, v.v...) hấu hết các công 
trinh nghiên cứu đều hát đầu bằng một giả thuyết và chấm dứt băng một kết 
luận. Ở giữa hai đoạn mở đầu và kết thúc đỏ là những phương pháp nghiên cứu, 
kết quả hay số liệu liên quan đến chủ để nghiên cứu, và cách diễn dịch số liệu. 
Tất cả các khâu nảy đểu có quan hệ với nhau một cách mật thiết. Phương pháp 
nghiên cứu không đúng sẽ dẫn đến hậu quả là số liệu thu thận sẽ không có giá trị 
hay khủng phủ hợp, và từ đó kết luận dựa trên số liệu có thể sai lầm. Do đó, tất cả 
các phần giả thuyết, phương nháp nghiên cửu, cách xử lỉ dữ liệu và số liệu, cũng 
như phần kết luận đểu có thể đặt dưới lăng kính của nhản nghiệm khoa học. Chi 
tiết về phương thức tiến hành một nghiên cứu khoa học như thể nàn chúng tôi 
sẽ trình bảy trong một địn khác. 


Mi tóm lại, phép phản nghiệm là một hành trang không thể thiếu cho một 
người làm khoa học. Nó bắt chúng ta phải “hoài nghỉ” một giả thuyết, và bằng 
phương pháp khoa học để có thể đi đến hác bỏ hay ủng hộ nó. Một giả thuyết 
không nhất thiết là phải “bị bác bỏ” nhưng phải có đặc tính “có thể bị bác bỏ, 
nếu không thì cẩn phải đặt vấn để là một giả thuyết “nguy khoa học” Chẳng hạn, 
Sinh học Tiến hỏa là một nghiên cứu về những biển đổi di truyền trong các quản 
thể, vi vậy nghiên cứu nảy không thể hị bác bỏ được, chỉ đơn giản là sự hiện hữu 
của nó như là hóa học, lí học hay vũ trụ học vậy. Sự tiến hóa là một thuật ngữ áp 
dụng cho một nhỏm đông các giả thuyết vả lí thuyết về sự biến đổi di truyền mả 
các kết quả thay đổi theo thời gian. Tất cả các giả thuyết và lí thuyết này đểu cỏ 
thể thử nghiệm được vả vì vậy má “có thể bác bả” chúng bằng cách trực tiếp hay 
gián tiến. Chọn lọc tự nhiên chẳng hạn, có lễ trong nhiều thập niên tới và nhiều 
thể ki tới không chắc mì có thể bác bỏ được những ý tưởng nghiên cửu nảy, tuy 
thể chúng sẽ vẫn củn có thể kiểm nghiệm được, vì vậy nó vẫn có thể bị bác hỏ 
được vả da đỏ vẫn có tính khoa học. 


Khoa học không phải sinh ra để chứng minh được mọi thứ. Mục địch của 
khoa học là để hỗ trợ hay loại trừ các ý tưởng bằng những bằng chứng hiện hữu. 
Mọi giả thuyết vả lí thuyết đếu phải được tiếp cận trước hết với một sự nghĩ ngữ, 
và chúng ta dùng phương pháp khoa học để bác bỏ nghĩ ngữ đó. Khoa học tiến 
hóa qua nhản nghiệm, và trì thức khoa học cũng được đúc kết qua nghiên cứu 
khoa học dựa vào triết l phản nghiệm. 
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03 
TÌM Y VĂN QUA PUBMED 


qua việc sử dụng bằng chứng hiện hành một cách có ý thức và công 
minh kết hợp với kỉ năng lãm sảng để đi đến quyết định về chăm sóc 
hệnh nhãn [1]. Y học thực chứng được thực hành qua 5 bước chỉnh [3]: 


«_ Đặt cầu hỏi lãm sảng thực tế, có thể trả lời được: 


Và thực chứng được định nghĩa là một phương pháp thực hành y khoa 


«_ Tim bằng chứng y khoa liên quan đến câu hỏi lắm sàng; 
« Đánh giả bảng chứng; 

« Ứng dụng bằng chứng vào bệnh nhân; và 

«_ Đánh giả hiệu quả của thực hành y học thực chứng. 


Một thành tổ quan trọng trong định nghĩa cũng như thực hành y học thực 
chứng là chứng cứ khoa học. Lượng thông tin y khoa tiếp tục gia tăng theo cấp số 
nhân [3|. Theo thống kê hiện hành, cứ mỗi 5 năm thì lượng thông tin liên quan 
đến ngành y sinh học lại tăng gấp đôi. Trước lượng thông tin khổng lỗ và gia tăng 
nhanh, việc cập nhật hóa với những tiễn bộ mới nhất trong ngành là một thách 
thức của người thấy thuốc lãm sảng và nghiên cứu y khoa. Ngày nay, bệnh nhân 
cũng thưởng sử dụng mạng để tìm thông tin y học. Do đó, người thấy thuốc củn 
phải đối đầu với một thách thức khác là kiểm tra, bình duyệt thông tin do bệnh 
nhãn đem lại và tìm những bằng chứng khoa học tốt nhất để đi đến những quyết 
định lãm sảng tối ưu. 


PubMled là một cơ sở đữ liệu được phát triển và quản lí bởi Trung tảm 
Quốc gia về Thông tin Công nghệ sinh học (National Center for Biotechnology 
Ininrmation hay NGBI) thuộc Thư viện Quốc gia Hoa Kỳ (National Lihrary oŸ 
Medicine - NLMI. Tỉnh đến năm 2007, PubMed có hơn lề triệu bải bảo khoa 
học từ MEDLINE và 5000 tập san y sinh học chọn lọc từ 7 quốc gia trên thể 
giới được lưu trữ từ những năm 1950 [4]. Mỗi ngày có nửa triệu người truy cập 
PuhMed để tìm thông tin. PubMIed là thư viện y khoa lớn nhất thể giới, và hoàn 
toản miễn phi. 

Công cụ để tim dữ liệu trong PuhbMled là Entrez. Entrez là hệ thống được 
thiết kế để người sử dụng có thể chỉ gõ vào một số thuật ngữ (hay thậm chỉ vải 
tử thông thường) để tìm các thông tin quan đến di truyền, protein, và bệnh lỉ 
học. PubMed hoàn toàn miễn phi cho tất cả mọi người trên thể giới. Địa chỉ của 
PuhMed là www.puhmed.gov hay www.pubmed.com. 

Trong hải nảy, tôi sẽ trình bảy một số phương pháp vả qui trình đơn giản 
để tìm y văn trong cơ sở dữ liệu Medline của PubMed. Vi PuhMed có rất nhiễu 
công cụ tìm kiểm, nhưng một số công cụ này chỉ dành cho các nhà nghiên cứu 
chuyên sẳu, nên tôi chỉ miởi hạn một số cũng cụ thực tiễn cho các bác sĩ lãm sảng 
băn rộn. 


1. Mật vòng PubMed 
Khi truy cập www.pubmed.com hay www.pubmed.gov, chúng ta sẽ có một 


giao diện như sau. Chủ ý rằng giao điện này có khi thay đổi theo thởi gian, 
nhưng nói chung các đặc tính chung thì cổ định (Hình 1). 


Hình T. Giao diện hiện nay [2018] của PubiMerl 
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Phia dưới hộp “PuhMed” là hộp trống và kẽm theo nút “search', ta tạm gọi 
đó là hộp tìm kiểm (search box). Đây là nơi chúng ta có thể gỗ vào bất cứ thuật 
ngữ nản để tìm y văn. Chúng ta sẽ quay lại những thuật ngữ nảy trong phần dưới 
cụ thể hơn, nhưng hiện tại, chúng ta chú ý vào những tận (tah) như Advanced 
Search (phân trên của hộp tìm kiểm), mục Clinical Queries và MeSH (phía 
dưới mục PuhMed Toals). 


Advanced Search là một công cụ tìm kiếm tương đổi tỉnh vĩ hơn, bằng cách 
dùng các “held” (tôi tạm dịch là “yếu tổ”) của một hải háo để tìm. Mỗi một hải 
háo được lưu trữ trong PuhMed gốm có nhiều yếu tổ để nhận dạng hải hảo. 
Những yếu tổ quan trọng nhất là tên bài báo (tite, viết tất là “TT”], tên tác giả 
(AU), tên tập san (TA), và chỉ tiết về năm xuất bản, số trang (Hình 3). 
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Hình 2. Mật số yếu tế nhãn dạng của một bài bảo trong PubMed 
Một số yếu tổ khác (vả viết tắt chuẩn) có thể xem trong bảng sau đây. 


Bảng 1. Yếu tổ nhận dạng của một bài bảo trong PubMed 


Yếu tổ của một bài báo Nghĩa 

Author [AU] Tác giả 

Eirst Author Name [LAU]| Tác giả đấu 
-1y- 


Afiliation [ADI| Địa chỉ làm việc của tác giả 
]aurnal Title [TA] Tân tận san 

Puhlicatinn Late [DEF| Ngày ấn bản 

olume [VI] ¬ö bộ của tập san 

Issue [TF] ö bộ của tập san 
PaginaHion [PG] ¬ũ trang 


Chúng ta có thể sử dụng những held (yếu tế nhận dạng] trên đây để gõ vào 
hộp tìm kiếm những hải háo cụ thể cho một tác giả cụ thể. Chẳng hạn như có 
thể tìm những hải bảo khoa học của tác giả “Hien TT” trang năm 2010, chúng ta 
chỉ đơn giản gõ “Hien TT [au| AND 2010 [dp]“ Chủ ý những từ viết tắt của ñeld 
được viết trong ngoặc vung (Hình 3). 
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Hình 3. Mặt vi dụ tìm bài bảo qua sử dụng yếu tế nhận dạng 
Vì một số tác giả có thể trùng tên, như Trần Tịnh Hiển hay Trịnh Thị Hoa 
hay Trương Trần Hùng, v.v... nên những bài bảo liệt kê có thể không chỉ của một 
tác giả. Tuy nhiên, chúng ta có thể sử dụng các yếu tổ nhận dạng để khu trủ cụ 
thể cho từng tác miả. Tuy nhiên, ở đây, tôi không chủ trạng vào cách tìm nảy, má 
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chỉ tập trung đến cách tìm cỏ liên quan tới thực 
hành y học thực chứng. 


Trong ví dụ tìm kiếm trên, chủng ta sử dụng 
giới tử “ÀAND” để tìm những bài báo của tác giả 
“Hien TT” cũng hố trong năm 2010. Các thuật 
toán tìm dữ liệu dựa vào ngôn ngữ logic, mà 
trong PubMled chúng ta hay sử dụng là AND 
và OR (viết hoa). 


Hình 4. Biểu đề VWenn 


Để hiểu hai giới từ nảy, chúng ta có thể xem 
qua Hinh 4 trên đảy. Trong hình này, nếu chúng ta gỗ “Hypertension” trong hộp 
tim kiểm, sẽ có 344225 hải báo; nếu gõ “Propranolol, sẽ có 37600 bài. Nhưng 
nếu chúng ta gỗ “Hypertension AND Propranolal, thì chỉ có 4155 bài, tức chỉ 
có 4155 bài với từ "Hypertension” và “Propranolol" Nhưng nếu chúng ta gỗ 
“Hypertensian OR Propranolnl” (tức Hypertension” hoặc “Prapranolol) thi kết 
quả sẽ là 277670 bái (lấy 244225 cộng với 37600 và trừ cho 4155). 


Sau lkhi đã biết qua vải giao diện chỉnh và cách tổ chức dữ liệu của PubMed, 
hãy miử chúng ta có thể thực hành tìm kiểm dữ liệu. Trong thực tế, những người 
tim đữ liệu và y văn trong PubMed có thể chia thành hai nhóm chính: nhóm bác 
sĩ lâm sàng rất bận, có it thì giờ để tìm hiểu chỉ tiết về những vấn để liên quan 
đến khoa học, vì mục tiêu chỉnh của họ là tìm y văn liên quan đến việc điểu trị cỏ 
thể cho từng bệnh nhãn cụ thể; nhóm thử hai nốm những bác sĩ và nhà nghiên 
cứu tim y văn để phục vụ cho việc nghiên cứu, và da đỏ, có thể họ cẩn thông tin 
chỉ tiết hơn là bác sĩ điểu trị. Vì thế, trong phần sau đây, tôi sẽ trình bảy cách tìm 
y văn cho hai nhóm vừa để cặp. 


2. Tìm kiếm nhanh (cho người có ít thì giờ) 
2.1. Tìm kiếm nhanh qua Chinical Queries 


Gãn đây, PuhbMcd giới thiệu một công cụ tìm dữ liệu có tên là Clinical 
Queries là tập hợp một số danh mục với những chủ để cụ thể, nhằm giúp cho 
các bác sĩ bận rộn tìm những thông tin y khoa một cách nhanh chẳng trong một 
thời gian ngắn. Ngoải ra, Clinical Queries còn có những đường dẫn (link) và 
khu trú một nhỏm dữ liệu được mục lục hóa trong PuhbMled. Clinical Queries có 
thể tìm tử trang đầu của PubMed như Hình 5 hưởng dẫn dưới đầy. 
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Hình 5. Tìm Clinical Queries trong PubMed 


Truy cặp vào PuhMed và chọn tệp Chnical Queries, chúng ta sẽ có một trang 
web mới với giao diện như Hình 6 dưới đây. 


PubMed Clinical Queries 
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Hình 6. Giao diện của Clinical Queries trong PubMerl 

Trong Clinical Queries chủng ta có thể tìm những đữ liệu theo 3 thể loại: các 
hải háo về y học lâm sảng (clinical strdy)}, tổng quan (systematic review}, hoặc di 
truyền (medical menetics). Mỗi mục có một hộp tìm kiếm riêng. Chúng ta thử áp 
dụng Clinical Queries để tìm y văn cho một vải trưởng hợp tiêu biểu như sau: 

Trưởng hựp 1: thông tin về di truyền. Miệt phụ nữ 24 tuổi muấn thản luận 
vẫi hắc sĩ vỀ những quan tâm của chị liền quan đến việc mang thai. VỊ phụ nữ này 
mỗi có gia đình khuảng 6 tháng trước, và hai vợ chẳng muốn cô can. Mật người chị 
của vị nhụ nữ này mặc bệnh u xử thân kinh (neuralbramaltosis], và chị quan tâm 
rằng can của hạ cô nguy cử mắc hệnh của người chỉ hay không. Câu hỏi lâm sàng 
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là, “Ở những phụ nữ với tiễn căn gia đình u xở thần kinh, xét nghiệm dỈï truyền nào 


cẩn làm để khuyến cán bệnh nhân?”. 


Một cách để trả lời câu hỏi này là truy nhập PubMed và gõ những thuật 
ngữ liên quan vàn hộp tìm kiếm (query box). Tuy nhiễn, PuhMled có một công 
cụ mới có tên là Medical Genetics Searches được phát triển cùng vửi nhóm 
nghiên cửu di truyển “Gene Reviews: Œenelic DMisease CÌine Reviews” để tìm 


những thông tin về rÌ truyền học. 


s Truy nhận PubÄlcd: www.nuhmedLcam và chạn tệp Clnical Queries dưới 
phần PuhMed Services như trang hình dưới đây. 
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Hình 6a. Gian diện của Medical Genetics Searches 


«Bảy giờ, PubMed sẽ liệt kẽ một danh sách gốm các hài bảo cỏ liên quan 
đến việc khuyến cáo (counseling}) bệnh nhân với bệnh di truyển u xơ 


thần kinh. 
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Hình 7. Kết quả tìm kiếm về di truyền (trường hợp TỊ 


Có thể xem Topiïc tại cột “Miedical Genetics” để có những bài báo liên quan 


đến di truyền và “Genetic Caunseling”: 


Medical Genetics 


Topiec ý All 
_  Diagnosis 

Diferential Diagnosis 

Clinical Description 

—— Management 

Resul Genetic Counseling 

Molecular Cenetics 


Genetic Testing 
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và kết quả tìm kiếm sẽ cụ thể hơn với 15 bài: ® Dị chuyển chuột xuống mục Clinical Study Category và gõ “osteoporosis 


AND đrugs” trong hộp tìm kiếm. 

Medical Genetics 

PubA@e4 Cñeical Querses 
Topic: cm... 

——_—- _= 
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Gabree M, Seidol M. 
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All N, Larođo JD, Gauéric A, Houđart E, øt ai Category và Scope. Ở tập Category = “ở 
Neurology. 2010 Jui 20; 75(3):259-64. chọn Therapy. Ở tệp Scope chọn 

h Results: 5 of 477 
The neurofibromatoses: hereditary predisposition to Narrow, chúng ta có (Hình 9). xe Glokse Y s?ddt4 HƯỚNG 
muitipie peripheral nerve tumors. at Corrosson-+elateđ Probkerns2 
Brooks DG. Smeh RỊ, Scearz EM. 
Neuzosurg Cân N Am. 2004 Aør; 15(2):145-55. ———————--——- 
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Trường hợp 2: thuốc điểu trị bệnh loãng xương. Giả dụ bạn là giảng viên Impact œ# the training on thô cornpliarace and persi31ence 


. * N * - * * + ° 
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Kết quả sẽ chủ thấy chỉ củ 11 bài theo Hiệu chuẩn trên (Hữc những bài tổng quan 
nghiên cửu trên ngưữi, viết hằng tiếng Anh, uà công hỗ trang vòng 5 năm qua]. 


3. Tìm kiểm y văn với MeSH 
3.1. Vải dàng về MeSH 


Trong phần trên, tôi đã mỗ tả một số thuật để tìm y văn trong tình huống 
không có nhiều thì giữ. Trong phẩn này, chúng ta sẽ tìm hiểu và thực hành một 
số thuật tìm y văn một cách có hệ thống hơn và chỉ tiết hơn, vốn rất có ích cho 
những bác sĩ nghiên cứu lãm sảng. 


Thuật ngữ y khoa rất... phong nhủ. Một khái niệm hay một bệnh có thể mỗ 
tả băng nhiều thuật ngữ dành cho giới khoa học hay từ ngữ thường dành cho 
công chúng và bệnh nhân. Chẳng hạn như ung thư có thể là neaplasm (đành cho 
giới học thuật), mả cũng có thể là cancer (từ ngữ thông dụng). Trong các thuật 
tim kiếm vữa mỏ tả, chúng ta chỉ gỗ một thuật ngữ hay thậm chỉ một tử thông 
thường như “hreast cancer” (ung thư vú) thì PubMed tự động “dịch” tử đỏ sang 
tử khỏa như “hreast neunlasms” Trong vài năm gắn đây, PuhbMed cho ra đời một 
cơ sử dữ liệu mới rất có ích và rất phổ hiến có tên là Medical Subject Heading 
hay viết tắt là MeSH [4]. 

MeSH là một từ điển điện tử gốm có khoảng 19000 ngữ vựng hay thuật ngữ 
(con số nảy tăng theo thời gian với bệnh và khái niệm mới), được sắp xếp theo 
giai tầng (hierarchical), tử những chủ để khải quát chung đến những chủ để 
chuyên biệt. Liệt kê sau đây là một số thuật ngữ MeSH có liên quan đến điểu trị 
mà chúng ta sử dụng thưởng xuyên. 


Bảng 2. Một số thuật ngữ MeSH phổ biến 
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3.3. lìm y văn qua MeSH 


Chúng ta có thể sử dụng MeSH để tìm kiểm những y văn chính xác và cụ thể 
cho vấn để chúng ta quan tâm. Vấn để chúng ta quan tầm có thể mô tả bảng công 
thức PICO, trong đỏ: 

s P= Patient hay Problem: bệnh nhắn hay vẫn để; 

s I=Intervention: can thiệp hay yếu tố nguy cơ (risk Eactor hoặc exposure} 

s C=Comparison: so sánh, tức có nhóm can thiệp và không can thiệp, hoặc 

yếu tố nguy cơ và không có yếu tổ nguy cư; và 

. 1= Outcome: kết quả lắm sảng. 

Trưởng hợp 3: digoxin và suy tìm. Bệnh nhân nữ 7ñ tuổi, với hệnh suy tim 
(congestiwe heart jailure} đến bác sĩ tư vấn. Bà dã ra vào bệnh viện để điều trị 
nhiều lần. Cầu hỏi bệnh nhân đi ra là nếu hà dùng cigoxin liệu củ hiệu quả giẳm 
tắn số tải nhận viên hay khẳng? 

Việc đầu tiên là chúng ta cần phải diễn giải câu hỏi bằng thuật ngữ tiếng Ảnh. 
Để tìm y văn một cách hữu hiệu, câu hỏi lầm sảng trên cẩn phải phản tích và cấu 
trúc theo cũng thức PICO như sau: 
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s®_ Datient/prohblem: đối với cầu hỏi trên, bệnh nhãn ở đây là congestive heart 
ure; 


s® Intervention củ thể là dignxin; 
® Comparison có thể là “caniroÏf” hay “na treatrnenF” 
s«_ Outcome là tải nhập viện (rehuspitnlizaiinn). 


Những thuật ngữ tiếng Anh này có thể gõ trực tiếp vào hộp tìm kiểm của 
PubMed để tìm những thông tin liên quan. Chúng ta sẽ sử dụng MeSH để tìm 
y văn liên quan đến câu hỏi. Tôi sẽ giải thích từng hước một vì qui trình tương 
đối chỉ tiết. 

s« Bước l: Truy cập PubMled www.pnubmed.gov, và chọn tệp MeSH (Hình 10). 
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Hình 10. Tìm MeSH, sẽ cha ra giao diễn như trên 
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« Bước 7: Ở hộp tìm kiếm, gỗ dòng chữ Tcongestive heart failure” và bấm 
Search. Kết quả sẽ như Hình 11 dưới đây. MeSH cung cấn một loạt thuật 
ngữ hay tử kháa dưới mục “congestive heart Eailure" Vì chúng ta muốn tìm 
hiểu về điểu trị nên chúng ta chọn mục “therapy”. 
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Hình 11. Kết quả tìm MeSH “congestiwe heart failure” 


Chú ý bên tay nhải của Hình 12 có hộp “PubMed Search Builder”, đây chỉnh 
là nơi để chúng ta xảy dựng các tiêu chuẩn tìm kiếm. Nên nhớ chúng ta mới 
tim thuật ngữ thử nhất là “congestive heart faillure”; chúng ta vẫn còn phải tìm 
digoxin, và sau đỏ AND hai thuật ngữ này với nhau. Do đỏ, bảy giờ chúng ta 
hấm ” Add ta search builder”, chúng ta sẽ có: 


PubMad Search Bulldar E= 
“Hœart Failure/therapy” [MHeah ] 


. Search PubMed . 
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e Bước 3: Ở hộp tìm kiếm MeSH, gõ dòng chữ '4igoxin” và bấm Search, 
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Hình 13. Kết quả tìm Congestive Heart Failure và Digoxin 
Nhưng chúng ta vẫn còn một keyword cẩn phải tìm hiểu nữa: đó là tái nhập 


viện. Chúng ta sẽ dùng PubMed thay vì MeSH để tìm “rehospitalization” (vì 
MeSH chưa có thuật ngữ này). 


Hình 12. Kết quả tìm MeSH cho “digoxin” 
Sau đó, chúng ta chọn “Digoxin” và đưa vào PubMed Search Builder: 
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Chú ý rằng bây giờ chúng ta có một hộp khác gồm những dòng chữ “Heart 
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Failure/therapy”[Mesh] AND “Digoxin”[Mesh]. Đây chính là cách PubMed 
điễn giải hai bước mà chúng ta mới làm. Nói cách khác, PubMed “biết rằng” 
chúng ta muốn tìm y văn liên quan đến digoxin và congestive heart failure. Chú 
ý phía dưới dòng chữ trên là “Search PubMed” Chúng ta nhấn vào nút này, 
PubMed sẽ liệt kê những bài báo (1633) đáp ứng tiêu chuẩn trên (Hình 13). 


Hình 14. Kết quả tìm PubMed cho “rehospitalization” 


Kết quả cho thấy có 2647 bài báo liên quan đến rehospitalization trong 
PubMed. Bây giờ đến bước thứ 4 là kết hợp cả 3 thuật ngữ: congestive heart 
ure, digoxin, và rehospitalization. 
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« Bước 4: Để kết hợp 3 biến trên, chúng ta dùng tệp Advanced Search. 


¡_Pggehaj | , †#s[eSMljdgiirer° 


[E1 Hãã Bex nmẾ Xem —) 
E9nglay #gErmm. |~i 5cs=ary, 2U pe: pin, Soriei bạ FiecmrEiy 2a Red la: (- 
Raãsults: 1 to TÚ eÍ 3647 Xe T l1 Men: lun 


fmzwe.Ïrerti+ sa. at: pzš Psfe-rä xi oyvrtrreeoi [: ñuuôe- Bay ioanierdl Lai, 
Ì. Luyện #É, he RA, lŠÖese MAI, Ê Le A, fekxii J, 

l lay nha: Sen Big 3014: 1 Ôi [Ấp BeEädl nể prrvị 

PRMTEE J577 €1? JEubktpJ : kí trẻủ Hài Ey 6v the; 

la: 271 

Darrisa FSág: lạc eị Tra äoiariaztorl h hơn Look Bí ä F rES2E7IE ƑTTERTTI 
+ Äulc?sy5 F, SuvPlä JB, [igtiiof l, Là5e?£ , FUPxk .] 

Trncin-dpiori CÚ L4 bu 2B BEpzì nen 2 Ì¬È 

PHI 1S FC f.tkee3 - lí ñeỹgi lăn ty [s.Ei2yUhdg) 

CÌ | 1#) %7 


Chọn Ädvance Search, chúng ta sẽ cỏ một mản hình mới (Hình 15). Chủ ý 
AÄdvanced Search cung cấp chủ chúng ta tiển sử (history}) của quả trình chủng 
ta tìm kiểm trong 3 bước trước. Mỗi bước được viết tắt bằng kỉ số. Trong ví dụ 
này, bước tìm rehospitalizaHon có kí số #5, bước tìm Heart Failure và [DDigoxin 
với kí số #3. 


ltuhlðcd Adtvarssed Šrarch Bluirder Raifl 5 


l onh nh Lazổi mi Dnitdvm Hộ cgohÕm prönar led): 


E# "he 

l: - dư 

====  Ö Erenmrẻm lại 

I-:--—-- 

CS“... ....s., DĐ. loa ilươøai  Tísg. 
tà thận CA: F-  FEế=irhyEe:LEl vÃ 8 don BH! 273% 
[| L— + TC man; E: [£rma2 Í gioc-eiEtamrsey" [Minesn š “hấp: “[l-gssarin "TM mi, l1 Xã 


Hình 15. Kết quả của Rdvancerl Search 


«@ Bước 5: Bảy giữ chúng ta có thể kết hợp quả trình tìm kiểm hàng cách 
dùng các kỉ số. Trong hộp All Fields trong Hình 16, gỗ: 


#5 ÄAND#3 


và nhấn nút Search để kết hợp hai tiêu chuẩn tìm kiếm với nhau. Kết quả cho 
thấy có 6 bái báo liên quan tới ảnh hưởng của dipoxin đến tái nhập viện ở bệnh 
nhắn suy tim: 
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Hình T6. Kết quả của tìm kiếm 


s Bước 6: Bảy giờ chúng ta có thể sử dụng tệp bên trái (có những lựa chọn 
như Article Types, Text Availability, Puhlication IDates, Species, v.v...) 
để giới hạn các nghiên cứu lắm sảng đổi chứng ngẫu nhiên (RCT} hay giới 
tính, hay ngôn ngữ, v.v... 

3.3. Tìm y văn bằng giao điện PICO 


Tìm y văn qua PubMed đổi hải người bác sĩ phải biết cách đặt vấn để qua 
công thức PICO như mô trả trong phẩn trên. Một số bác sĩ, do chưa quen với 
MeSH (vả qui trình cũng khả nhức tạp], nên một nhỏm nghiên cửu bên Mĩ phát 
triển một giao diện “interface” với PubMed để giúp cho việc tìm y văn dễ đàng 
hơn. Giao điện này trong thực tế vẫn củn trang giai đoạn thử nghiệm, nhưng tôi 
thấy cũng có ích cho những ai không muốn tiêu nhiều thời gian với MeSH. Dao 
đó, trang phần nảy, tôi sẽ giới thiệu ngắn về giao điện PICO [5]. Truy cập vào 
địa chỉ http://pubmedhh.nÌm.nih.gov/nÏm/picostudy/pico2.html chúng ta sẽ có 
một giao diện như sau: 
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Hình 17. Gian diện PICO 


Như có thể thấy, giao diện này được thiết kể theo công thức PICO và gọn 
nhẹ hơn MeSH. Trong hộp Patient/Problem, chúng ta chỉ cẩn gỗ bệnh hay vấn 
để (chẳng hạn như “congestive heart failure"}; hộp Intervention để ghi can thiệp 
(như “digoxin”}, Compare to để ghỉ nhóm số sảnh (chẳng hạn như ”“Control”); 
và phần Outcome để điển vào chỉ tiêu lãm sảng (như “mortality”). Ngoài ra, 
chúng ta cũng có thể giới hạn nhóm tuổi, giới tỉnh, và thể loại nghiên cửu trong 
các mục kể tiến. 

Vĩ dụ: Chúng ta muốn tìm các bải tổng quan cỏ hệ thống (systematic reviews}] 
về thuốc bisphosphonates trang điểu trị luäng xương với outcome phải là gãy 
xương (fracture) ở nữ bệnh nhãn trên 65 tuổi. Chúng ta có thể điển vào PICO 


như sau: 
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VÌ trang web này vẫn còn trong vòng thử nghiệm, nên chưa được ứng dụng 
rộng rãi. Tuy nhiên, trong điểu kiện tìm nhanh, trang giao diện này cũng là một 
công cụ tìm kiểm rất đơn giản vả cỏ ích. 


4. Kết luận 


Y học thực chứng là một cuộc cách mạng quan trọng trong y học. Trong y 
học thực chứng. dữ liệu khoa học thay vì ý kiến chuyên gia đồng vai trỏ quan 
trọng trong quyết định lầm sảng, kiến thức được đúc kết từ những nghiên cứu 
khoa học hơn là tử những gi bác sĩ biết dưới danh nghĩa “kinh nghiệm, và những 
niễm tin được thay thể bằng những chứng cử có thẩm định lợi và hại. Thực hành 
y học thực chứng đói hỏi người thấy thuốc phải có kĩ năng tìm kiểm và thẩm 
định y văn. Bải viết mang tính hướng dẫn từng bước nảy hi vọng đã cung cấp cho 
các bác sĩ một vải kĩ năng cẩn thiết trang việc tìm kiếm y văn. 

Đổi với người Việt Nam chúng ta, một trong những khó khăn trong việc sử 
dụng PubMled là vấn để thuật ngữ tiếng Anh mả một số bác sĩ và điểu dưỡng vẫn 
chưa quen. Da đá, để sử dụng PubMed một cách hữu hiệu, thiết tưởng việc học 
tiếng Anh và thuật ngữ y khoa cũng như thuật ngữ khoa học tiếng Anh là điểu 
rất cần thiết trong thởi hội nhận thể giới. 


PuhMled là một nguồn tải liệu y văn vỗ giá chao bất cử ai làm việc trong ngành 
y tế hay có liên quan đến y sinh học. Với PuhMled, chúng ta có thể cập nhật hóa 
thông tin về hất cử lĩnh vực hẹp nào. Người phương Tây thường nói “thông tin 
là sức mạnh” (infnrmation is power). Sự nhát triển không ngừng của PuhMIied đã 
cung cấp một “sức mạnh” cho giới y sĩ tuản cấu, và với thông tin đã biết hi vụng 
răng chất lượng chăm sóc bệnh nhẫn sẽ ngày một tốt hơn. 
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PHÂN BIỆT NGHIÊN CƯU 
VÀ GIÁ TRỊ KHA HỌC 


vào các dữ liệu y học một cách sáng suốt và có ý thức, nhằm nẵng cao 
chất lượng chăm súc bệnh nhãn. Dữ liệu y học là những kết quả nghiên 
cứu đã được công bố trên các tập san hay diễn đàn y học. Sử dụng dữ liệu y học 
một cách “sáng suốt và có ý thức” có nghĩa là người thấy thuốc phải cần nhắc, 
đánh giá, phản loại các dữ liệu nghiên cửu y học, kết hợp cùng kinh nghiệm lắm 
sàng, và thông tin từ bệnh nhãn để đi đến một quyết định tối tu cho bệnh nhẳn. 


X: nhắc lại: y học thực chứng là một phương pháp thực hành y khoa dựa 


Một trong những yêu cầu của thực hành y học thực chứng, như vữa để cập 
trên, là người thấy thuốc cũng như bệnh nhân phải biết cách xử l¡ dữ liệu y học 
một cách sáng suốt. Nói cách khác, không chỉ là tiếp nhận dữ liệu, người thấy 
thuốc phải hiểu dữ liệu đỏ có ý nghĩa gì, và có đảng tin cậy hay không, để từ đó đi 
đến những sa sánh khách quan hơn vả quyết định tốt hơn. Thể nhưng trong thực 
tế thi rất it thấy thuốc hiểu các dữ liệu khoa học trong các nghiên cứu y khoa. 
Theo một thống kẻ gắn đảy trên Tập san F4 MA, có đến 90% bác sĩ không hiểu 
ý nghĩa của những số liệu và phản tích trong các hải báo y học! Điểu này thực 
ra cũng không có gì đáng ngạc nhiên và cũng chẳng phản ảnh khả năng chuyên 
mỗn của bác sĩ, hởi vi trang quả trình huấn luyện ở trưởng y, sinh viên ít khi nào 
được tiếp cận với các phương pháp dịch tế hạc và nhất là thống kẻ học, cho nên 
khi ra trưởng họ không năm vững các kỉ năng quan trọng nảy. 


-h/- 


Nghiên cứu y học rất tư đa dạng, nhưng giá trị khoa học của mỗi mỗ hình thì 
rất khác nhau. Cùng là một vẫn để y học và có thể cùng lrết quả, nhưng kết quả từ 
nghiên cửu theo mỗ hình can thiệp củ đỗi chứng cỏ giả trị hơn kết quả tử nghiên 
cửu quan sát. Do đỏ, một trong những kĩ năng đầu tiên để thẩm định giá trị khoa 
học, người thấy thuốc phải biết nhân biệt mỗ hình nghiên cứu. Trong chương nảy 
tỗi sẽ giải thích cụ thể những mỏ hình nghiên cửu y học thưởng hay được sử dụng. 

Bảng 1 dưới đây trình bảy các mỗ hình nghiên cứu y học và bậc thang giả 
trị theo phãn loại của y học thực chứng. Theo cách nhân loại này, các ý kiến của 
chuyên gia có giả trị thấn nhất, và nghiên cứu lắm sảng đổi chứng ngẫu nhiên 
(RCT) được xem là có giá trị khoa học cao nhất. 

Bảng 1. Nẵc thang giá trị khoa học cho các loại nghiền cứu 


Mô hình nghiên cứu Vài đặc điểm chính 


Ý kiến của các chuyên | Thường là các bài báo được các tập san 
gia, bài điểm báo, mùi viết. 
xã luận. bình luận. 
Nghiên cứu cøbản — | Các nghiên cứu sơ khởi trong phòng thí 
trên tế bảo, chuột và —_ | nghiệm về một phân tử hay tác nhân cụ 
động vật cấp thấp. — | thể 
Kinh nghiệm điều trị về một hay vải 
trưởng hợp lâm sảng đặc biệt và hiếm 
thấy. 
Mục đích thưởng là tức tính tỉ lệ hiện 
hành của bệnh (prevalance) và các yếu tố 
liên quan đến bệnh trong một quần thể. 
Mục đích là tìm hiểu mỗi liên hệ giữa 
một yếu tổ nguy cơ và bệnh tật. 


Nghiên cứu “đoàn Mục đích thường là ước tính tỉ lệ phát 
hệ? theo thời gian sinh của bệnh (incidence} và các yếu tố 
(Erosnectivei liên quan đến bệnh trang một quần thể. 
longitudinal study). 
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Sử dụng trong việc thẩm định mức độ 
hiệu nghiệm của một thuật điểu trị lằm 
sảng trang một nhóm đối tượng cụ thể. 


Tổng hợp các kết quả nghiên cứu RCT. 
Crss-sectimn, langittdinal và 
case-conrol. 


1. Ý kiến cá nhân và điểm hảo, xã luận 


Một số bài báo trên các tập san y học xuất hiện dưới các tiêu để như ediforial 
(xã luận), caœmmentary (bình luận), và review (tổng quan). Đây là những bài da 
han hiển tập tập san mới tác giả đóng góp. Các tác giả thường là các chuyên gia 
nổi tiếng trong chuyên ngành, những người có nhiều đỏng góp cho lĩnh vực 
chuyên sâu nào đó. Những hải này cũng có qua bình duyệt của ban biên tập, 
nhưng qui trình duyệt hải không nghiêm ngặt như những bài báo nguyễn thủy 
(ariginal napers). 


Then quan điểm của y học thực chứng, những hải xã luận, bình luận, và tổng 
quan là những ý kiển cá nhän. Mà, ý kiến cá nhân thì thường, không it thì nhiều, 
mang tỉnh chủ quan. Đỏ là chưa kể một số giảo sư có những mỗi liên hệ mật 
thiết với công ty thuốc, nên ý kiến của họ có thể bị lu mở bởi mỗi liên hệ như thể. 
Gần đây, người ta phát hiện có khả nhiều người đứng tên tác giả những hải tổng 
quan, nhưng trong thực tế họ không hể viết, mả công ty mướn người khác viết 
hộ, và các giáo sư chỉ đứng tên để... lấy tiển. Trong hối cảnh như thế, những hải 
háo tổng quan (đặc biệt là tổng quan về thuốc} có giá trị khoa học rất thấp. Nói 
chung, đây là những bài bảo có giá trị thấp nhất trong khoa học, vì chúng chẳng 
cung cấp một bằng chứng khách quan, mả chỉ là những ý kiến cá nhân. 


2. Nghiên cứu cơ bản (basic research) 


Trong y học, các nghiên cứu cơ bản đáng vai trỏ rất quan trọng và rất cẩn 
thiết. Không có các nghiên cứu này, chúng ta chắc chân không có một nến y 
học hiện đại như hiện nay. Đối tượng của những nghiên cứu nảy thưởng là các 
dòng tế bảo, nấm, chuột, thỏ, cả, v.v... Đó là những nghiên cứu khởi đầu để thử 
nghiệm một giả thiết khoa học cụ thể não đỏ. Lợi thể của nghiên cứu cơ bản là 
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nhà nghiên cứu có thể kiểm soát các yếu tố nhiễu, hay kiểm soát tất cả các yếu tổ 
củ thể làm cho kết quả hị sai lệch. Nhưng vì chỉ là nghiên cửu sơ khởi và không 
tiến hành trên bệnh nhắn, cho nên đổi với y học thực chứng giả trị khoa học của 
các nghiên cứu nảy rất thấp, chỉ hơn ý kiến cả nhắn một hậc mả thôi. 


Rất nhiều kết quả nghiên cứu cơ bản không có giá trị lãm sàng thực tế. Trang 
một bài tổng quan gắn đây, các tác giả duyệt qua các công trình nghiên cứu được 
công hỗ trong thời gian 1979 - 1983 trên 6 tập san danh tiếng về nghiên cứu 
cơ bản [1]. Dự vào các tiêu chuẩn chọn và loại trừ, họ có được TÚI công trình 
mả ứng dụng trên người được xem là có triển vọng rất cao. Tuy nhiên, khi làm 
nghiên cứu RCT:, chỉ cỏ 19 nghiên cứu có kết quả được xem là "dương tính”; 
trong số này chỉ có 4 có thể ứng dụng vào lãm sảng nhưng rất hạn chế. Chỉ cỏ 
một nghiên cứu cơ bản duy nhất (trong số 101) là có ứng dụng lắm sảng thành 
công, đỏ là công trình dẫn đến phát triển thuốc angiotensin-converting enzyme 
innhihbitors. Do đó, dù kết quả nghiên cứu cơ bản có thể rất tốt, nhưng giả trị và 
ng dụng trang lầm sảng có thể rất thấn. 


3. Bảo cáo ca lâm sàng (case reports) 


Băng chứng có giả trị can hơn nghiên cứu cơ bản là các báo cáo ca lãm sảng. 
Trong nhiễu tập san y học, giới nghiên cửu thưởng hảo cản trưởng hựp hệnh 
nhắn rất đặc biệt, rất hiếm, những trưởng hợp bệnh khó chẩn đoán, hay những 
trưởng hợp bệnh lí chưa được mỗ tả trong sách giáo khoa, những ca giải phẫu 
ngoạn mục, v.v... Cũng có những báo cáo về thành công trong điểu trị một 
nhóm bệnh nhãn mả chưa từng được háo cáo trước đây. 

Báo cáo ca lắm sảng có giả trị kính nghiệm rất tốt, nhưng trên phương điện 
khoa học, các báo cáo này không có giá trị khoa học cao. Lí do là vì không có 
nhóm chứng, và bệnh nhân cũng khả đặc hiệt, nền rất khỏ suy luận về nhẫn quả 
và cũng khó khái quát hỏa cho quần thể hay bệnh nhãn khác. 


4. Nghiên cứu cắt ngang (cross-sectional studies) 

Các nghiên cửu cỏ giả trị khoa học trên ca lãm sảng là nghiên cửu tiêu biểu 
một thứi điểm, hay có thể gợi là “nghiên cửu cắt ngang”. Nghiên cứu cắt ngang 
tửng là một trong những mỗ hình nghiên cứu phổ biến nhất trong v học, vì tính 
đơn giản của nó và không tốn nhiều thì giữ. Nghiên cửu cắt ngang cung cấn cho 
chúng ta một “snapshot” — hức ảnh chụp nhanh về một vẫn để. 
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Nghiên cứu cắt ngang được xếp vào nhỏm nghiên cứu mỗ tả, nhất là loại 
nghiên cứu mang hình thức điểu tra xã hội (survey). Phẩn lớn các nghiên cửu 
cắt ngang có mục tiêu đơn giản là ước tỉnh tỉ lệ hiện hành (prevalence) của một 
hệnh hay yếu tổ nguy cơ. Nhưng cũng cỏ loại nghiên cứu cắt ngang mang tỉnh 
phân tích, má mục tiêu là thu thập dữ liệu để thẩm định mỗi liên quan giữa các 
yếu tổ. 


Ví dụ l1: Công trình nghiên cứu loãng xương ở Thành phố Hồ Chỉ Minh, 
mục tiêu chính là ước tính tỉ lệ hiện hành loäng xương ở cư dân trên 50 tuổi 
của Thành nhố [3|]. Các nhà nghiên cửu lên danh sách các đổi tượng tử một số 
phường / quận, dùng máy tính để chọn ngẫu nhiên những cá nhắn, và gửi thư 
mới tham gia nghiên cứu. Vì loäng xương (asteonorosis) được chẩn đoản tử đo 
lường mặt độ xương (bone mineral density], nên mỗi đối tượng tham gia nghiễn 
cứu đểu được đa mặt độ xương bằng máy DX À. Dựa vào mật độ xương, các nhà 
nghiên cứu có thể ước tính tỉ lệ hiện hành loãng xương. 


Nghiên cửu cắt ngang còn có thể dùng để ước tính tỉ lệ hiện hành cho hơn 
một yếu tổ hay một bệnh. Vì đối tượng được chọn ngẫu nhiên và mang tỉnh 
đại diện quẩn thể, nên các nhà nghiên cứu có thể thu thập thêm dữ liệu. Chẳng 
hạn như trong nghiên cửu trên, các nhà nghiên cứu thu thập mẫu máu và nhân 
tích nẵng độ vitamin D trang mắu, tử đó có thể xác định hao nhiễu người thiểu 
vitamin D trung cộng đẳng [3]. 

Ngoài mật độ xương, các nhà nghiên cửu còn thu thập nhiều dữ liệu khác 
về tiển sử bệnh tật, lối sống, thỏi quen hút thuốc lá và uống bia rượu, cùng các 
thông tin về tẻ ngã và nấy xương. Tất cả những thông tin này chỉ thu thập tại một 
thời điểm, dù câu hỏi có thể liên quan đến quả khứ. Chẳng hạn như khi hỏi về 
hút thuốc lá, các nhà nghiên cứu hỏi hút thuốc lá từ lúc bắt đầu cho đến nay (thởi 
điểm thực hiện nghiên cứu). Những thông tin này có thể biến công trình thành 
một nghiên cứu nhân tích, chứ khẳng đơn thuần là mô tả. Chẳng hạn như nhà 
nghiền cứu có thể nhân tích mỗi liên quan giữa vận động thể lực và tỉ trọng mỡ 
trong cơ thể, hay mỗi liên quan giữa hút thuốc lá và loïng xương. Do đó, nghiên 
cửu cắt ngang có thể sử dụng cho nhiễu mục tiêu mỗ tả và nhân tích. 

Nghiễn cửu quan sát có khi giúp chúng ta phát triển mỗ hình tiên lượng. 
Chẳng hạn như trong một nghiên cứu tại Thành phổ Hồ Chí Minh nhằm tiớc 
tính tỉ lệ nam và nữ mắc bệnh tiểu đường [4], một nhóm 721 nam vả 1421 nữ, 
tuổi từ 30 đến 72, được chọn ngẫu nhiên từ Thành phố. Qua phần tích nẵng độ 
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glucose, các tác giả ước tính rằng tỉ lệ mắc bệnh tiểu đường là 111% ở nam và 12 
ở nữ. Nhưng quan trọng hơn, hai yếu tổ có liên quan mặt thiết đến nguy cũ mắc 
hệnh tiểu đường là huyết áp tầm thu và tỉ số vòng eo trên vàng mỗng WHR — 
waist to hip ratio). Dựa vào hai yếu tổ nguy cử này, các nhà nghiên cứu phát triển 
hai biểu để tiền lượng cho nam và nữ như sau. 


Bieu đổ tiên lương nguy cơ bệnh tiếu dưỡng cho nam [trải] và nữ [phải]. 
Mãi biểu đồ có 3 cột: huyết áp tầm thu, nguy cơ bệnh, và WHR. 
Vi dụ sử dụng: mặt trung niễn cỏ huyết áp tâm thu là T5Ũ mmmHg và WHR là 0.8, chỉ cần nối 150 
ở cột T và 0.80 ở cột 3, dường giao chéo với cột 2 chỉnh là nguy cơ bệnh tiểu đường. 
Trong vỉ dụ này, nguy cơ là khoảng 10%. Tham khảo: Ta MT, et aÏ Diabetologia, 2010. 


Tuy nhiên, nghiên cửu quan sắt không thể cho phép chúng ta kết luận về mỗi 
liên hệ nhân quả. Chẳng hạn như chúng ta không thể nái hút thuốc lá làm tăng 
nguy cơ loãng xương, cho dù cỏ mỗi liên quan đỏ trong nghiên cứu. Lỉ do là vì 
nghiên cứu chỉ cung cấp cho chúng ta một “bức tranh” tại một thời điểm, chúng 
ta không biết nếu đối tượng ngưng hút thuốc lá thì nguy cơ loãng xương có suy 
giảm hay không. [Do đó, giá trị khoa học của nghiên cứu cắt ngang chỉ cao hơn 
háo cáo ca lãm sảng. 
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5. Nghiên cứu bệnh chứng (case-control study) 


Các nghiên cứu cỏ giả trị khoa học “trung hình” là các case-contrnl study. Trong 
các nghiên cứu nảy, mục đích chỉnh là tìm hiểu mỗi liên hệ giữa một yếu tổ nguy 
cũ và một bệnh cụ thể. Đây là một mỗ hình nghiên cứu mang tỉnh nhân tích, chứ 
không phải mỏ tả. Nếu nghiên cửu cắt ngang thu thập dữ liệu ngay tại thời điểm 
nghiên cửu, thi nghiên cứu bệnh chứng thu thập dữ liệu ngược thời gian. 


Ví dụ 2. Để xác định hút thuốc lá là một yếu tổ nguy cơ ung thưi phối [5|], hai 
nhà nghiên cứu Richard [all và Bradifard HilÍ tiến hành một nghiên cửu bệnh 
chứng mang tính lịch sử như sau: 

s Bước thứ nhất: chọn một nhỏm hệnh ung thư phổi. các nhà nghiên cứu 

chọn được 649 người; 


s Hước thứ hai chọn nhóm chứng (gọi là canirols) không bị ung thư phối 
(nhưng cỏ một số bệnh khác), 709 người. Những người này được chọn sao 
cho họ có những đặc điểm như tuổi, cần nặng, giới tính, v.v... giống như 
nhóm bệnh; 

«@ Hước thử ba: các nhà nghiên cửu nhỏng vẫn mỗi bệnh nhãn và mỗi cá 
nhãn trong nhóm chứng về thỏi quen cũng như liều lượng hút thuốc lá 
trang thời gian trước đây. 

Kết quả cỏ thể tôm lược trong Bảng 2 dưới đây. Trong số 648 bệnh nhắn ung 
thư phổi, có 647 người hút thuốc lá (99.7). Trang số 649 người trong nhóm 
chứng, số hút thuốc lả là 632 (hay 95.8%). Nên nhớử rằng đây là thời thập niên 
1950, nên cỏ rất nhiều đản ông hút thuốc lá. 

Bảng 2. Hút thuốc lá và ung thư phổi 


Hút thuốc lá Nhóm hệnh Nhắm chứng 
Húi thuc lả 647 622 
Không hút thuốc lá 2 +7 
Tổng số 649 648 


Làm cách nào để đánh giá mối liên quan giữa hút thuốc lá và ung thư phổi? 
Các nhà nghiên cửu tỉnh: 
® odds hút thuốc lả trang nhỏm tung thư: 647 ƒ 2 = 323.5 
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s pdds hút thuốc lá trong nhóm chứng: 622 / 27 = 13.04 

s Tỉ số odds (còn gọi là odds ratio), OR = 323.5 / 23.04 = 14.0 

Dựa vào kết quả tính toản trên, các nhà nghiễn cứu có thể điễn giải rằng hút 
thuốc lá tăng odds mắc bệnh ung thư phổi 1 4 lần. Sau vải thao tác thống kẽ, các 
nhà nghiễn cứu kết luận räng kết quả này (OR) có ý nghĩa thống kẻ. 


Qua ví dụ trên, chúng ta thấy nghiên cứu bệnh chứng là một mỗ hình nghiên 
cứu rất tốt cho các bệnh hiểm. Đỏ cũng là một mỗ hình nhanh và rẻ tiền để 
nghiên cứu về yếu tổ nguy cơ. Nhưng không phải ai cũng có thể lắm nghiên cứu 
hệnh chứng, hởi vi mỗ hình nghiên cứu này đòi hỏi suy nghĩ cẩn thận và chọn 
nhóm chứng cho thích hợp. Nghiễn cứu bệnh chứng rất đễ hị bias (xem Chương 
BIA5)] do nhỏm chứng được chọn không đại điện chủ quần thể. Ngoài ra, nghiên 
cứu bệnh chứng không cho phén chúng ta phát biểu về một mỗi liên hệ nhãn quả. 


6. Nghiên cứu đoàn hệ (prospprective cohart study) 


Nghiễn cứu có giả trị can hơn nghiên cửu bệnh chứng là các nghiên cửu theo 
thời gian, có khi còn gọi là “nghiên cứu đoàn hệ” (xuất phát từ chữ cahurt studly). 
Trong nghiên cửu đoàn hệ, một nhóm đổi tượng được chọn [có thể là ngắu 
nhiên trong cộng đồng, quần thể], và họ được theo dõi một thởi gian có thể dao 
động từ 2 năm đến 5Ũ năm để quan sát sự thay đổi về yếu tổ nguy cơ và các biến 
cổ lâm sảng xảy ra trong thời gian theo dõi. 


Vì thể, mục đích của các nghiên cứu đoàn hệ là tìm hiểu mỗi liên hệ miữa một 
hay nhiễu yếu tổ nguy cơ và nguy cử phát sinh bệnh tật. Cần nói thêm ở đây là 
khác với nghiên cứu cắt ngang mà nhà nghiên cửu chỉ có thể ước tỉnh rỉ lễ hiện 
hành (prevalence)., với nghiên cứu đoàn hệ cho phép nhà nghiên cứu có thể tiớc 
tính rỉ lệ phát sinh (Incidence) bệnh. Nghiên cứu đoàn hệ có thể cung cấp chủ 
nhà nghiên cứu rất nhiều thông tin. Có thể xem nghiên cứu đoàn hệ có hai nhân: 
phần ban đấu (baseline) có thể xem như là một nghiên cứu cắt ngang, và nhắn 
theo đõi trong tương lai. Vì thế, nhà nghiên cứu có nhiều cơ hội để khám phả các 
mỗi liên quan giữa hbaseline và biến cổ trong tương lai, nhưng cũng cỏ thể phần 
tích sự thay đổi về yếu tổ nguy cơ và khả năng mắc hệnh. Đảy là một mỏ hình 
nghiên cứu thưởng được sử dụng để phát triển các mỗ hình tiên lượng ung thư, 
tim mạch, nấy xương, v:v... 
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Quả khứ Hiện tại Tương lai 


Mghitn cửu cắt ngang 


Hình 1. Phãn biệt ba mõ hình nghiên cứu cắt ngang, bệnh chứng và doàn hệ 


Hinh 1 trên đảy phản biệt ba mỗ hình nghiên cứu (theo thời gian tỉnh): 
nghiên cửu cät ngang ở thời điểm hiện tại, nghiên cứu bệnh chứng đi ngược về 
quả khử, và nghiên cứu đoàn hệ đi về hướng tương lai. Nghiên cứu đoàn hệ cho 
phép ước tính tỉ lệ mắc bệnh trang một thởi gian nhất định và đánh giá yếu tổ 
nguy cơ liền quan đến hệnh. 

Ví dụ 3. Công trình nghiên cứu loïng xương có tên là Duhbbo Csteoporosis 
Epidemiolngy Study (DOES) là một trong những nghiên cứu qui mô lớn và lầu 
nhất trên thể giới |6]. Một trong những mục tiêu chính của DÖES lúc đó là định 
nghĩa mỗi liên hệ giữa loäng xương (hay mặt độ xương] và nấy xương, nhưng 
cũng xác định tỉ lệ louäng xương trong cộng đồng. Để đáp ứng những mục tiểu 
đó, các nhà nghiên cửu tiến hành như sau: 

s® Bước thứ nhất: dựa vào danh sách đân cư của thành phố Dubbo (lúc đó có 
khoảng 30000 dẫn), các nhà nghiên cứu chọn ngẫu nhiễn trên 2000 nam 
và nữ trên 6ñ tuổi. Thời gian tuyển chọn từ 1989 đến 1993. 

s- Dữ liệu baseline: mỗi đối tượng được tuyển chọn được khám sức khoẻ cẩn 
thận, trải qua một loạt xét nghiệm để đánh giá mật độ xương, khả năng 
tẻ ngã, lực của cơ, v.v... Các dữ liệu về nhãn trắc, lỗi sỗng. tiền sử bệnh và 
dùng thuốc cũng được thu thập lúc ban đầu. 

«Sau đỏ, cử mỗi 2 năm, các đối tượng được mởi đến trung tắm để tải khám 
và làm các xét nghiệm như lúc ban đầu. Nghiên cứu theo đãi các đổi tượng 
tử 1989 - 1993 đến 2011. 

s® Trong thời gian theo dõi đỏ, các biến cổ lãm sảng như gãy xương, ung thư, 
tiểu đường, và tử vong được thu thận. Mỗi liên hệ giữa các yếu tố nguy cư 
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(thu thập lúc baseline) và nguy cơ phát sinh bệnh có thể phân tích qua mỗ 
hình nghiên cửu nảy. 

Chẳng hạn như để đánh giá mỗi liên quan giữa loãng xương và nguy cơ gẫy 
xương. các nhả nghiên cửu dựa vào mặt độ xương (đo lúc ban đấu, baseline) để 
phân thành hai nhóm bệnh nhân: nhóm loãng xương và không laäng xương. Sau 
đó, các nhà nghiên cứu quan sắt trang mỗi nhóm từ 1989 đến 2004, có bao nhiễu 
người bị nãy xương. Có thể xem qua qui trình qua để thị dưới đây. 


t5ẫy xLưững 
| p) Lý tam bả) 


1?Ê7 nữ 
60+ tuổi 


ty xương: Ì 


C) HN. J| 


Hình 2. Mối liên quan giữa laäng xương và qãy xương 
Lúc ban đầu, 137 nhụ nữ (345 trong số 1287) được chẩn đoản là loãng 
xương. Tử 1989 đến 2004, nhóm này có 137 người bị gắy xương; như vậy nguy 
cơ gãy xương là 39.7% (137 trên 345). Tương tự, lúc ban đầu có 945 hay 73% phụ 
nữ không bị loãng xương; sau 15 năm theo dõi, nhóm này có 191 người hị gấy 
xương. và tỉ lệ là 20.2%. Có thể tóm lược dữ liệu trong Bảng 3 sau đây. 


Bảng 3. Mỗi liên quan giữa loïäng xương và gãy xương 


Nhám Gãy xương Không näy xương Tổng số 
_ Loãäng xương 137 208 345 

Không loãngxương — 191 75] 942 

Tổng số 1287 


Bảng số liệu trên cung cấp cho vải số liệu quan trọng. Trước hết là tỉ lệ hiện 
hành về loãng xương là 27% (3415/1287). Như nói trên, nghiên cứu đoàn hệ cho 
phép nhà nghiên cứu ước tính nguy cơ hay tỉ lệ phát sinh bệnh. Trang trường 
hợp này, 
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s« Nguy cơ gảy xương ở nhóm bệnh nhân loäng xương là: R, = 137/345 = 
ũ.387 
« Nguy cơ gẩy xương ở nhóm không loäng xương là: R, = 191/942 = 0.202 
s_ Do đó, tỉ số nguy cơ Írisk ratia, hay rekafive risk, hay viết tắt RR] là: 
R,_ 0391 


R, 0202 


Chỉ số RR cho chúng ta biết nhóm loäng xương có nguy cơ gấy xương cao 
gắn gấp 2 lấn so với nhỏm không hị loãng xương. Nói cách khác, loäng xương 
tăng nguy cơ gãy xương nấp 2 lần. 

Chỉ có nghiên cửu đoàn hệ mới tỉnh được RR. Các nghiên cứu cắt ngang 
không tính được RR. Nghiên cứu bệnh chứng chỉ có thể ước tính odds, vả tỉ số 
adds (ÖDR). nên cũng không tỉnh được RR. Tuy nhiên, với giả định bệnh hiểm (tức 
nguy cơ rất thấp, dưới 1%], thì OR cỏ thể xem là một ước số đáng tin cậy của RR. 


7. Nghiên cứu lắm sàng đỗi chứng ngầu nhiên (RCT) 


Các nghiên cứu vừa nêu trên là những nghiên cửu quan sát (nhservaHonal 
studies), vì nhà nghiên cứu không can thiệp vào đổi tượng. Nghiên cứu RCT 
(randomized controlled trial) là mô hình giống như nghiên cứu đoàn hệ, nhưng 
chỉ khác là có chia nhằm ngẫu nhiên lúc ban đẩu và có can thiệp. Ngược lại 
với các nghiên cửu quan sát, thử nghiệm RCT là những nghiên cứu nhằm thử 
nghiệm mức độ ảnh hưởng, mức độ hiệu nghiệm của một sự can thiệp. “Can 
thiệp” ở đây phải hiểu là những thuật điểu trị, kể cả thuốc và phẫu thuật, nhưng 
tôi sẽ chú trọng vào các RCT thử nghiệm thuấc. 


RCT được xem phương pháp vàng, tiêu chuẩn vàng trong nghiên cứu y học. 
Chứng cử tử nghiên cửu RCT được xem là có giá trị khoa học cao nhất so với các 
nghiên cửu quan sát. Mỏ hình nghiên cứu RCT được xem là phương pháp vàng 
để đánh giá hiệu quả và an toàn của một can thiệp. Tất cả các can thiệp nếu chưa 
qua RCT thi chưa thể xem là cỏ chứng cử thuyết phục. Rất nhiễu phương pháp 
điểu trị có triển vọng rất tốt trong các nghiên cứu quan sát hay nghiên cứu trên 
chuột, nhưng khi qua nghiên cứu RCT thi đếu thất bại. Có thể nói răng RCT là 
một thử nghiệm acid quan trọng cho hất cứ một can thiệp y khoa nào. 


Mặc dủ ý tưởng về chia nhóm ngẫu nhiên RCT đã được "thai nghén” từ lâu 
(1923), nhưng chỉ được triển khai lẩn đầu vào năm 1946 ở Ánh để đánh giá 
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hiệu quả của streptomycin trong điểu trị bệnh lao phổi [7|]. Năm 1946, một ủy 
han gợi là Medical Research Counril [MRC] 5treptomycin Tuherculosis TriaÌs 
Coammittee được thành lập, do Ngài Geoffrey Marshall làm chủ tịch, và nhà 
thống kê Ngài Austin Bradford Hll làm giám đốc điểu hành công trình nghiên 
cứu. Bệnh nhãn được chia thành hai nhóm một cách ngẫu nhiên (nhóm điểu 
trị và nhóm chứng), và đánh giá về TB dựa vào X-quang mả người đọc không 
hiết bệnh nhãn thuộc nhỏm nảo. Thời đỏ, nhóm chứng có thể xem là không vi 
phạm y đức vì thuốc streptomycin do Mĩ cung cấp củn hạn chế (thời nay thi một 
nghiên cửu như thế không thể chấn nhận được). Kể từ đó đến nay, RCT đã được 
phát triển rất rộng rãi và trở nên một mỏ hình nghiễn cứu quan trọng trong 
khoa. Có năm, ông Bradford Hill được để nghị trao giải Nobhel vì sáng kiến cực 
kì quan trọng này, nhưng rất tiếc ông đã qua đời, nên ủy ban giải Nohbel không 
thể xem xét trưởng hựp của ông. 

Có khả nhiều cách thiết kế nghiên cứu RCT, nhưng tôi chỉ nói đến một đạng 
nghiên cứu thông thưởng nhất: đó là nghiên cứu gốm hai nhóm hệnh nhẫn 
(củn gọi là narallel design). Để mình họa cho khái niệm RCT, tôi sẽ lấy ví dụ của 
công trình nghiên cứu Wioruens HienÌth IniHiatives [B] làm vỉ dụ. Trong cũng trình 
nghiên cửu nảy, các nhà nghiên cửu muốn thử nghiệm hiệu quả của caÌcium và 
vitamin D truong việc phòng chẳng gấy xương ở các phụ nữ sau thời mãn kính. 
Họ tiến hành những hước sau đây: 


s Bước thứ nhất: chọn một quần thể gốm 36282 nhụ nữ sau mãn kinh (tuổi 
tử 50 đến 79), thu thập tất cả các dữ liệu lãm sảng liền quan; 


s Bước thứ hai: dùng máy tính để phản chia quấn thể đó thành hai nhóm 
một cách ngẫu nhiên: nhóm 1 gốm có 18176 phụ nữ được điểu trị bằng 
calcium vả vitamin D hàng ngày (nhóm can thiệp); nhóm 2 pốm 18106 
phụ nữ cùng độ tuổi nhưng không được bổ sung calcium hay vitamin D 
(còn gợi là nhóm chưng hay pÌacebn}, 

« Bước thử ba: theo đỗi hai nhóm can thiệp và đối chứng trong thời gian 
10 năm (tỉnh trung bình là 7 năm, vì một số qua đời, một số mất liên lạc, 
và một số không muốn tiếp tục tham gia công trình nghiên cửu). Trang 
thời gian này, các nhả nghiên cửu tiếp tục thu thập dữ liệu lãm sảng và đa 
lượng sinh hóa để theo dõi tình trạng của bệnh nhãn, cũng như ghi nhận 
số nhụ nữ hị nấy xương; 
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« Hước thử tư: sau khi hết thời hạn theo dõi, các nhà nghiên cửu lên kế 
huạch phãn tích dữ liệu xem xét hiệu quả của vitamin D và calcium đến 
việc miảm nguy cử gãy xương. Kết quả chỉnh của công trình nghiên cứu cỏ 
thể tóm lược bằng Bảng 4 như sau. 

Bảng 4. Tóm tắt kết quả chính của một nghiên cửu RCT 


Nhóm can thiệp Nhóm đối chứng 


(CaD) (placebo) 
Sũ phụ nữ 18176 18106 
Thời gian theo dõi (năm) 7 Fị 
¬ũ phụ nữ bị gãy xương đủi 175 lụ8 
Tỉ lệ (®] bị gầy xương đủi ũ.% 1.10 


Dựa vào các số liệu trên, các nhà nghiên cứu có thể tính tỉ lệ nhát sinh (nguy 
cơ) vả tỉ số nguy cơ RR như một nghiên cứu đoản hệ: 


s Nguy cơ gầy xương ở nhỏm Cai: R, = 175 / 18176 = 0.0086 
« Nguy cơ gấy xương ở nhóm chứng: R, = 199 / 18106 = 0.011 
«Do đỏ, tỉ số nguy cơ (RR) là: 


Vì RR thấp hơn 1, chúng ta có thể nói nguy cơ mấy xương đủi trang nhóm can 
thiệp thấn hơn nhóm đối chứng khoảng 13. Nhưng tỉ số này có ý nghĩa thống 
kê hay không là một vấn để khác má tôi sẽ giải thích sau. 


Nền nhở rằng trong nghiên cứu nảy, nhóm điểu trị và nhỏm chứng được 
phân chia một cách ngẫu nhiên, nên tất cả các yếu tổ có thể ảnh hưởng đến kết 
quả đếu cần bằng. Hai nhóm có cùng độ tuổi, phần hỗ giới tính, thành nhân 
kinh tế, lỗi sống. tiền sử bệnh, và tất cả các yếu tố khác. Nếu không có ảnh hưởng 
của Cai, chúng ta kì vụng RR = 1. Nhưng trong thực tế, RR = Ö.87, và kết quả 
này chỉ có thể qui về CalD. Nói cách khác, nghiên cửu RCT cho phép nhà nghiên 
cứu có thể phát biểu về mỗi ảnh hưởng nhân quả mà không có mỗ hình nghiên 
cứu nảo khác có thể. 


8. Phân tích tổng hựp (Meta-analysis) 


Thông thưởng với bất cứ một thuốc nảo hay một thuật điểu trị nảo, một 
nghiên cứu RCT đơn lẻ không thể nào giải quyết đứt khoát vấn để hiệu quả, 
mả thưởng cần phải có nhiều nghiên cứu độc lặp nhau. Nhiễu nghiên cứu trên 
nhiều quản thể khác nhau, dù cỏ cùng mục đích và tiến hành với một phương 
pháp chuẩn, cỏ thể cho ra nhiều kết quả khác nhau, thậm chỉ trải ngược nhau. 
Trước sự khác biệt về kết quả như thể, vấn để đặt ra là làm sao hệ thống hỏa 
tất cả các kết quả nghiên cứu này để cho ra một “đáp số. một "phản quyết” sau 
cùng. Gần đây, có một nghiên cứu mới ra đời có tên là “meta-analysis” má tôi 
tạm dịch ra “phản tích tổng hợp” (chứ không phải “phản tích mộp' ). vì thực chất 
của các nghiên cửu nảy là phân tích tất cả các kết quả nghiên cứu trong quá khử. 
Trong y hạc thực chứng, kết quả phân tích tổng hợp các RCT được đánh giá là 
có giá trị khoa học cao nhất. 


Để minh họa cho nghiên cứu này, tôi lấy một ví dụ mả chúng tôi vừa tiến hành 
như sau. Các thuốc trang nhóm bisphosphonates (như alendronate, residronate, 
etidronate, v.v...) thưởng được sử dụng trong việc điểu trị loãng xương, và liết 
quả của nhiễu nghiên cửu RCT cho thấy thuốc có hiệu quả giảm nguy cơ gầy 
xương cột sống (vertebral fracture), nhưng các nghiên cứu này cho thấy hiệu quả 
của chúng trong việc nhủng chống gãy xương đùi (híp Íracture) chưa rõ rằng, 
vì kết quả quả khác nhau. Để trả lời câu hỏi “Bisphosphonates có hiệu quả làm 
giảm nguy cơ gäy xương đùi hay không?” chúng tôi đã tiến hành một phản tích 
tổng hợp như sau [9]: 

s Bước thứ nhất: sử dụng hệ thống PuhbMled và Medline để truy tìm tất cả 
các nghiên cửu trung quả khử liên quan đến thuốc hisphosphonates có 
liên quan đến tỉ lệ mấy xương đủi, những nghiên cửu này phải hội đủ một 
số tiêu chuẩn như: phải là nghiên cửu RCT; đối tượng là phụ nữ sau thời 
mãn kinh, có mật độ xương BMID thấp, đã được ủy ban y đức thông qua, 
V.V... 


s_ Bước thử hai: sau khi đã có danh sách các nghiên cửu, chúng tôi phát triển 
một qui trình thu thập và chiết dữ liệu. Khi chiết dữ liệu xong, so sánh 
xem có sự khác biệt về số liệu giữa hai người thu thận hay không; nếu có 
thi phải xem xét lại tại sao và quyết định; nếu không có khác biệt thì tiến 
đến bước thứ ba. Kết quả thu thập dữ liệu có thể tôm lược bằng một bảng 
thẳng kẻ (xem Bảng 5 dưới đây). 
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® Hước thứ ba: nhập dữ liệu vào máy tính và dùng các phương pháp phân 
tích thống kê để ước tỉnh mức độ hiệu nghiệm của bisphosphonates cho 
tất cả các nghiên cứu. 
Bảng 5. Tám tắt kết quả chỉnh của một meta-analysis: 
xỉ dụ về nghiên cứu bisphosphonates và nguy cơ gẫy cổ xương đủi 


Tác giả nghiên cửu Nhóm hbisphosphoanate Nhằm chứng 


và nằm N Fx N Fx 
Storm et al. 1990 33 3 33 1 
Harris et alL 1993 212 3 211 1 
Liherman ct al. 1895 5g? 3 397 1 
Black et al. 19886 1232 +2 105 l1 
nummings et al. 1998 3314 34 221B 18 
Bamnick et aÍ, 1998 5ñ3 3 135 5 
Pols et al. Iøga 851 3 9hh 3 
(zreensnan et al. 2002 lã5 4 lã2 3 
Harris et al. 12939 4ã3 15 45 12 
Reginster et aL 2000 4ủa l1 đi¬ g 
McClung et aÌ. 2001 3624 40 1821 55 
McLlnskey et† al 2004 g2 Ỗ 301 1 


Ghi chủ: MN là sẽ đối tượng, Ex là số ca gãấy xương đủi. 


Sau cùng là nhân tích dữ liệu. Có khả nhiều phương pháp phản tích dữ liệu, 
nhưng phương phán đơn giản nhất là tính RR cho từng nghiên cứu, và sau đỏ 
tính RR cho tất cả các nghiên cứu. Nhưng vi mỗi nghiên cửu cỏ số lượng đổi 
tượng khác nhau, nên không thể chỉ đơn giản lấy trung bình của tất cả các nghiên 
cửu, mả phải tính trung hình trọng số (weighted average}. Trong trưởng hợp 
trên, trọng số chính là số đối tượng hay phương sai nghịch đảo của từng nghiên 
cứu. Nghiên cứu cỏ số đổi tượng nhiễu, phương sai sẽ thấp, và trọng số sẽ cao. 
Có thể thể hiện RR cho từng nghiên cứu qua biểu đỗ forest như sau. 
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FELATIVE RISK 


Biểu đổ farest [rừng] trình bày tỉ số nguy cơ RR cho từng nghiên cửu, 
và RR cho tất cả nghiên cửu sau khi dã hiệu chỉnh trạng sẽ. 
Sau khi nhân tích, chúng tôi có được RE trung hình là 0.58, với khoảng tin cậy 
858% dao động từ (1.42 đến 0.80. Nói cách khác, tính trung bình bisphosphonates 
giảm nguy cơ gấy xương đùi khoảng 42%. 


Cẩn phải nói thêm rằng, phản tích tổng hựp không chỉ áp dụng cho việc hệ 
thống hóa các nghiên cứu RCT; mả còn có thể áp dụng để tổng hựp kết quả tử 
các nghiên cửu cắt ngang, nghiên cứu bệnh chứng và nghiên cứu đoàn hệ. Trong 
mãy năm gẩn đây, trước tỉnh trạng các nghiên cứu đơn lẻ cho ra quả nhiễu kết 
quả khác nhau khó diễn dịch, phản tích tổng hợp đã trở thành một phương tiện 
nghiên cứu rất thông dụng. Không chỉ trong lĩnh vực nghiên cửu y khoa, mả các 
lĩnh vực khác như sinh học, nông nghiệp, tâm lí học, xã hội học, giáo dục, kinh tế 
học, v.v... đếu bát đẩu sử dụng phản tích tổng hựp rất nhiễu. Đối với nghiên cứu 
sinh hay sinh viên mới vào nghề cẩn làm quen với y văn về một hộ môn nào đó, 
qui trình phản tích tổng hợp giúp cho họ có một cải nhìn khái quát về lĩnh vực đả. 
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Trên đây chỉ là khái quát về những nghiên cứu y học mà bạn đọc hay tìm 
thấy trong các tập san y khoa trên thể giới. Hiểu biết được sự khác nhau giữa 
các nghiên cứu và nắc thang giả trị khoa học của chúng là một bước đâu trong 
việc thẩm định thông tin khoa học. Ngoài việc đó, người đọc còn phải đặt một 
số câu hỏi thông thưởng như: nghiên cứu này được tiến hành ở đâu, do ai làm, 
đối tượng trang nghiên cứu thuộc độ tuổi và giới tính nào, có bệnh gi, thời gian 
theo dõi bao lâu, các dữ liệu được phản tích như thế nản, cách diễn dịch có phủ 
hợp với dữ liệu hay không, và quan trọng là nghiên cứu đã được công hỗ chưa, ở 
đâu. Tất cả các câu hỏi này sẽ giúp cho người tiến nhận thông tin quyết định xem 
các kết quả nghiên cứu có giá trị gì hay không, và nếu có thì chúng có áp dụng 
cho cá nhãn mình hay không. 


9, Đánh giá nghiên cửu 

Phân hiệt nghiên cửu y học và má trị là một hước quan trọng trang thực hành 
y học thực chứng. Nhưng đứng trước một nghiên cứu, chúng ta cẩn phải đánh 
giả nghiên cứu đỏ. Đánh giá thì cần phải có tiêu chuẩn. Y học thực chứng để ra 
3 tiêu chuẩn chung để đánh giả một nghiên cửu y học: 

«Tỉnh hợp lí hay chính xác, còn gợi là walility, 

« Tấm quan trọng của kết quả nghiên cửu; 

s Tỉnh liên đới: kết quả nghiên cứu có thể ứng dụng cho bệnh nhằn? 

Tĩnh hợp li 

Khái niệm hợp lí hay chính xác có lẽ xuất phát từ lí thuyết đo lưỡng. Trang 
lí thuyết đo lưởng, cẩn phải phân biệt hai khái niệm chỉnh xác (accuracy hay 
walirlity) và tin cậy (reliability). Chúng ta sẽ thấy phản hiệt hai khải niệm nảy có 
liên quan đến việc đánh giá một nghiên cửu y học. 

Một phương pháp đo lường chính xác cho ra kết quả chúng ta biết là đúng. 
Chẳng hạn như chúng ta đúc một khung xương với mật độ chất khoáng là 
lg/cm°. Nếu chúng ta dùng một phương pháp để đa mặt độ chất khoáng trang 
khung xương vả cho ra kết quả 1 gicm° thì đó là phương pháp chỉnh xác, vì nhản 
ảnh đúng giá trị thật. Nhưng nếu một phương nhán khác cho ra kết quả Ú.7g!cm° 
hay 1.6g/cm°, thi phương pháp đỏ không chính xác. 

Nếu một phương pháp đo lường được lặp đi lặp lại nhiều lần trên cùng một 
đối tượng vả cùng một điểu kiện cho ra những kết quả giếng nhau, phương pháp 
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đó được xem là có độ in cây cao. Chẳng hạn như phương pháp đo lường nồng 
độ leptin đa 5 lần cho ra kết quả như sau: 5.10, 5.11, 5.09, 5.07, 5.10. Tất cả các 
giả trị này đểu rất giếng nhau, phản ảnh một độ tin cậy cao. 

Phương pháp đo lưỡng tốt nhải chính xác và đáng tin cậy. Có thể xem kết quả 
của một nghiên cứu khoa học như là thước đo về một giả thuyết khoa học. Kết 
quả nghiên cứu, thể hiện qua dữ liệu, "gẩn” hay xa với giả thuyết khoa học chính 
là phản ảnh độ chỉnh xác. Nếu lặp lại nhiều lần, kết quả nghiên cửu giống nhau, 
đó chính là độ tin cậy. Dao đá, chúng ta có thể dùng khải niệm chỉnh xác và tin 
cậy để đánh giả kết quả nghiên cứu. 

Kết quả nghiên cửu khoa học cỏ thể đánh giả qua hai tiêu chuẩn về hợp lỉ: 
hợp lỉ nội tại (internal validity)} và hựp lí ngoại tại (external validity). Nói một 
cách ngắn gọn, hợp lí nội tại phản ảnh những vẫn để liên quan đến thiết kể 
nghiên cứu, phương pháp đa lường, và phương pháp phản tích. Hựp lí ngoại tại 
liên quan đến khả năng khái quát hóa chao quần thể lớn hơn. Hợp lí ngoại tại liễn 
quan đến tiêu chuẩn tuyển chọn bệnh nhắn, còn hợp lỉ nội tại liên quan đến các 
khia cạnh kĩ thuật của nghiên cứu. Khi đánh giá một nghiên cứu RCT, chúng ta 
cần đặt những câu hỏi cụ thể sau đây để biết mức độ hợp lí ra sao: 

s Tất cả bệnh nhân vàn nghiên cứu được theo dõi cẩn thận, lí do bỏ cuộc 

được phi chén đây đủ? 


«Có bao nhiễu bệnh nhân hỏ cuộc nghiên cửu? Trên 204? 

se Bệnh nhän tham gia nghiên cứu đại điện quấn thể đổi tượng (target 
population}? 

s Bệnh nhän được phản nhóm một cách ngắu nhiên (randomization)? 
Phương pháp phần chia ngẫu nhiên được mỏ tả kĩ cảng? 

s«_ Phản tích theo cách thức “intentiun to treat”? 

s Các đặc điểm lãm sảng lúc đâu (baseline characteristics) của hai nhỏm 
tương đương nhau? 

s Mù đôi (double blinding) được duy tri? 

Tim qrữn lrụng 

Cần phải phản biệt một kết quả có nghĩa thống kẽ với một kết quả có ý nghĩa 

lãm sảng. Một nghiễn cứu với nhiều đối tượng nghiên cứu, hầu như bất cử một 
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khác biệt nhỏ nào cũng có ý nghĩa thống kệ (P < 0.05). Do đó, một ảnh hưởng 
cỏ ý nghĩa thống kê chưa hẳn là có ý nghĩa lãm sảng. Ngược lại, có trường hợp 
mả kết quả không cỏ ý nghĩa thống kê (da không đủ cũ mẫu), nhưng có thể có 
Ý nghĩa lãm sảng. 


Để đánh giá tẩm quan trọng của ảnh hưởng, chúng ta cẩn xem xét mức độ 
ảnh hưởng (efect size — ES). Tùy theo mỗ hình nghiên cứu, E5 có thể là tỉ số 
nguy cơ, tỉ số odds, hiệu số của hai số trung bình, v:v... Chẳng hạn như trong 
công trình HES, một nghiên cứu RCT, nhằm so sánh hiệu quả giảm tử vong của 
siumvastatin (một loại thuốc giảm cholesterol), các nhà nghiền cửu chia 20536 
đổi tượng tuổi 4ñ - 80, thành hai nhóm và theo dõi trong 5 nắm. Kết quả cho 
thấy simvastatin miảm nguy cơ tử wong 13%. Tuy nhiên, nếu mỗ tả bảng nguy cơ 
tuyệt đối, sự khác biệt giữa nhóm simvastatin và nhóm chứng chỉ 1.8%. Vấn để 
đặt ra là một mức độ ảnh hưởng như thế có quan trọng hay không còn tùy thuộc 
vào hối cảnh. Theo tôi, một can thiệp mả có thể giảm gẩn 2% tử vong là một ảnh 
hưởng quan trọng, nhưng nếu miảm 2% cholesterol (ví dụ) thì không thể xem là 
quan trạng. 


Hấu hết các can thiện đểu có lợi và có thể gãy tác hại. Dao đó, mức độ ảnh 
hưởng củn phải xem xét với khả năng gây tác hại. Nếu một can thiệp giảm nguy 
cử gãy xương đùi 2#, nhưng tảng nguy cử ung thư vú 3, thi cẩn nhải xem lại 
hiệu quả của can thiệp đó. 

Tĩnh liên đải 


Một trong những câu hỏi quan trọng khi đọc xong một nghiên cứu là: kết 
quả nảy có thể ứng dụng cho bệnh nhän của tôi? Trả lời câu hỏi này đỏi hỏi 
chúng ta phải xem xét đến tiêu chuẩn chọn bệnh nhân của công trình nghiên 
cứu. Trong thực tế, các hệnh nhản được tuyển chọn vào các nghiễn cứu RCT 
thưởng rất khác với các bệnh nhãn mà hác sĩ gặp hàng ngày vốn đa dạng hơn, 
phức tạp hơn các bệnh nhân trong RCT. Chẳng hạn như trong nghiên cửu về 
luäng xưiững, các nghiên cửu RCT thưởng chọn bệnh nhân đã bị gãy xương, có 
mật độ xương thấp, không bị các bệnh khác có thể gây rỗi loạn trong quá trình 
chuyển hỏa xương, v.v... Có thể nói đỏ là những bệnh nhân khỏe mạnh. Nhưng 
trong thực tế lãm sàng, có khi bác sĩ điểu trị bệnh nhãn hị loãng xương nhưng 
chưa gãy xương. Có quan điểm cho rằng RCT là một phương pháp tuyệt với để 
đánh giá một can thiện cho một nhóm bệnh nhân, nhưng là phương pháp tôi 
cho mỗi cá nhân! 


Một vẫn để khác cẩn quan tâm là thuật điểu trị mới có tốt hơn liệu nháp hiện 
hành không. Phần lớn những nghiên cứu RCT chỉ so sánh thuốc mới và nÌacebo, 
chứ không so sánh thuốc mới với thuốc cũ. [3o đó, chúng ta không biết hiệu quả 
của thuốc mi và thuốc đang sử dụng ra sao. 


Một khia cạnh khác cũng cần chủ ý đến là chỉ nhi điểu trị. Phẩn lớn các thuốc 
mới đếu đất hơn thuốc cũ, và có lí do chính đáng cho tỉnh trạng nảy. Tuy nhiên, 
mức độ khác biệt về chỉ nhỉ điểu trị (giữa thuốc mới và thuốc cũ) cẩn phải được 
đánh giả và so với hiệu quả lãm sảng. Nếu hai loại thuốc mới và cũ có cùng hiệu 
quả lắm sảng cho củng một nhỏm bệnh nhắn, và nếu thuốc mới đất hơn thuốc 
cũ, thi chúng ta biết quyết định nảo cỏ lợi nhất cho bệnh nhãn. 


10. Nhận xét thêm 


Tài đã điểm qua 8 mỏ hình nghiên cửu y học phổ biển. Nhưng trong thực 
tế, nghiên cứu y học không phải chỉ giới hạn trong 8 mỏ hình đó, mà có thể có 
nhiều mö hình khác, đặc biệt là các thí nghiệm lắm sảng. Nhưng vấn để chính 
chúng ta quan tắm ở đây là giá trị khoa học của nghiên cứu. Đứng trước một vẫn 
để y khoa, nhà nghiên cứu có nhiều lựa chọn mỗ hình nghiên cứu. Chẳng hạn 
như nếu nhà nghiên cứu muốn đánh giá mỗi liên quan giữa bổ sung vitamin 
và gäy xương, một số mỗ hình có thể nghĩ đến: 

s Ca lãm sàng: duyệt qua những ca lãm sàng đã từng được bổ sung vitamin 

D vả quan sắt số ca bị gấy xương; 

s« Bệnh chứng: chọn một nhỏm gãy xương và một nhóm chứng, thu thận đữ 
liệu về bổ sung vitamin D trong quá khử, và phản tích mỗi liên quan giữa 
hai biến; 

s Nghiên cửu cät ngang: thực hiện một nghiên cửu cắt ngang trên N đổi 
tượng, phỏng vấn mỗi đối tượng để biết có bổ sung vitamin D và có hị gắy 
xương, và phân tích tương quan; 

s Nghiên cứu đoàn hệ: thực hiện một nghiên cứu trong cộng đồng với N đối 
tượng, đánh giá hổ sung vitamin D lúc ban đấu. Then dõi các đối tượng 
một thởi gian, quan sắt số ca gầy xương, và phản tích mỗi tương quan giữa 
gầy xương và bổ sung vitamin D; 

s RCT: chọn một nhóm đổi tượng theo tiêu chuẩn định trước, chia thành 
hai nhỏm một cách ngẫu nhiên: một nhỏm được bổ sung vitamin D, một 


- rỗ - 


hffps://tieulun.hopto.org 


nhóm chứng. Theo dõi hai nhóm trong một thời gian. Phần tích sự khác 6. Nguyen TV,etalL Life style factors and hone denstty in the clderly: Implications 


biệt về tỉ lệ gãy xương giữa hai nhóm. Íor asteoporosis nreventiun. ƒ Buane Älimer Res 1894; 9:1339-1346. 

«_ Phản tích tổng hợp: nhà nghiền cứu có thể duyệt qua các nghiên cứu trước 7. _ MRC 5treptomycinin Tuhberculosis Trials Cornmittee. 5treptomycin treatmment 
đây về hổ sung vitamin Ï} và gẩy xương, và tiến hành một phản tích tổng of pulmonary tuberculosis. BAIJ 1948;2:769—83. 
hợp. 8. Jackson, ED, La Croix ÄZ, Gass M, et aL Caldlum Plus Vitamin D 

« Nghiên cứu trên chuột: nhà nghiền cứu cũng có thể tìm một nhóm chuột supplementatian and the Risk of Fractures. New Engl Ï Med 2006; 354: 669-683. 
thích hợp và chia ngẫu nhiên thành hai nhóm như nghiên cứu RCT, nhưng 8. Nguyen NH, Eiaman JA, Nguyen TY. Ant-hip Í[racture eflcacy of 
thay vì quan tâm đến gãy xương, nhà nghiền cứu có thể xem xét cấu trúc bisphosphonates: a Bayesian analysis oÍ clinical trials. ƒ Bame Mlimer Re: 
xương vả lực của xương. 2006; 21: 340-540. 

Mỗi mô hình nghiên cứu trên đều cung cấp vải thông tin có ích. Nhưng 1Ũ. Heart ProtecHon Study Collaborative Group. MRC/BHF Heart Protection 


giá trị khoa học của thông tin thì còn thy thuộc vào mô hình nghiên cứu (xem Study oÍ cholesterol [mwering with simvastatin in 20,536 hipgh-risk individuals: 
Bảng 1). Hiện nay, y học thực chứng xem RCT hay phản tích tổng hợp RCT SE TISLEUNSNUIEEEIINGSIUUUIGG 

có giả trị cao nhất là xuất phát từ quan điểm lãm sảng vả thực tế. Một mỗ hình 11. Larson EB. N-oí-I trials: À technique for Improving medical therapeutics. Wesi 
nghiên cửu khác, có tên là N-of-I trial [11], có thể côn có giả trị khoa học cao J Med 1990,152:52-56. 

hơn cả RCT. Mỏ hình M-of-1 trial thực chất là nghiên cứu giao chéo (cross-over) 

trên mỗi bệnh nhân. Nái cách khác, mỗi bệnh nhắn nhận can thiệp Ä, rỗi sau 

đó B; củn bệnh nhãn khác có thể B rỗi đến A. Tuy nhiên, mỏ hình này chưa phổ 

hiển và trang nhiều trưởng hợp không thể án dụng được nên chưa được bản đến 

ử đây. 
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Ưu điểm và yếu điểm của vải mô hình nghiên cứu 


Uu điểm 
Có thể nghiên cứu toàn hộ một quẩn 
thể, 
Ước tính tỉ lệ hiện hành bệnh và các 
yếu tổ nguy cơ; 


Có khả năng khái quát hỏa rộng hơn; 


Tương đãi đề thực hiện. 

Rất đễ bị bias (như "survival bias, 
hiện tượng bệnh nhän sỗng läu và có 
thể làm cho việc ước tính tỉ lệ hiện 
hành không đúng với thực tế); 

Dễ bị sai lắm trong phân nhôm 

(vi bệnh nhân... quên); 

Không thể phát hiểu về nguyên nhân 
và hệ quả {vi chỉ 1 thời điểm); 
Không thực tế đối với các bệnh hiếm. 


Lu điểm 

Không thể phát biểu về nguyên 
nhãn và hệ quả (dù thông tin về yếu 
tổ nguy cơ được thu thập trước khi 
bệnh phát sinh); 

Có thể nghiễn cửu các bệnh hiếm 
hay với tần số thấp. 


Ưu điểm 

Rất hữu hiệu cho các bệnh hiếm; 
Không tốn lim; 

Có thể thực hiện nhanh. 


Yếu điểm 

Dễ bị “selecHon hbias” và chọn sai 
(đối tượng nghiên cửu); 

Dễ hị sai lắm trang việc phản bệnh; 


Không thể phát biểu về nguyên nhân 
và hệ quả. 


Ưu điểm 

Giảm các yếu “tổ nhiễu” có thể ảnh 
hưởng đến bệnh nhưữ trong các 
nghiên cửu cắt ngang; 

Có chọn nhỏm ngắu nhiên; 


Có thể phát biểu về nguyễn nhân và 
hệ quả. 


Tốn kém thời gian và tiến; 
Đối tượng “bỏ cuộc” hay “lost ta 


Enllnmw-up. 


Rất tốn kém thời gian vả tiến; 


Đổi tượng “bỏ cuộc” hay “Ïost to 
Follow-up. 


- ln - 


https://tieulun.hopfo.org 


DIỄN GIẢI KẾT QUẢ 
NGHIÊN CỨU RCT 


ta thưởng gặp những thuật ngữ như risk, risk raïin, ndd:š ratin, hazard 

ratin. Một risk ratio bằng .Bã8 có nghĩa gi? Và khoảng tin cậy 959 
(hay "95 percent confidence interval”) có nghĩa gì? Tại sao các nhà nghiên cửu có 
thể kết luận về hiệu quả tử những chỉ số này? Trong chương nảy tôi sẽ giải thích 
ý nghĩa thực tế của những chỉ số này. 


T rong y văn, đặc biệt là các bảo cáo liên quan đến nghiên cứu RCT, chúng 


Có thể nói một cách vỉ van rằng hoạt động khoa học là những căn, đa, đong, 
đếm. Thật vậy, có thể nhìn một công trình nghiên cứu y khoa như một thử 
nghiệm thống kế. Nhà nghiên cứu hắt đầu bằng một giả thiết, rồi thu thận dữ 
liệu, phân tích dữ liệu xem chúng có phù hợp với giả thiết đó hay không. Thành 
ra, kết quả của một nghiên cứu y khoa thưởng được tớm lược băng những số 
liệu thống kẻ. Ởi đây, cần phải nhấn mạnh rằng trong y khoa, chúng ta không thể 
chứng minh một giả thiết nào đỏ là thật hay không thật; chúng ta chỉ có thể nói 
số liệu thu thận được có phù hợp hay không phủ hợp với giả thiết đó mà thôi. Đó 
là một sự “khiêm tốn” má bất cử nhà khoa học chân chỉnh nào cũng phải năm 
lòng khi phát biểu về một phát hiện khoa học. 

Số liệu thống kê được trình bảy bằng nhiều cách khác nhau tử những phương 
pháp phân tích khác nhau cho từng dạng nghiên cứu. Ở đây, tôi chỉ tập trung 
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vào những chỉ số thường hay gặp trong các bải báo khoa học với hi vụng sẽ giúp 
cho bạn đọc hiểu và hiểu rõ những số liệu đỏ có ý nghĩa gì, chứ không có tham 
vọng trình bày tất cả các phương pháp thống kẻ. Trước hết xin nói qua vải khái 
niệm căn hẳn. 


1. Khái niệm nguy cơ (risk) 

Ở đây tôi thấy cần phải nói vải hàng về cụm từ “nguy cơ”, dịch từ chữ risk 
trong tiếng Ánh, vì nó có rất nhiễu nghĩa trong y khoa. Trước đây, có người nói 
y khoa chỉ biết đếm có hai số: ñ là không có bệnh, 1 là mắc bệnh. Nhưng y khoa 
thể kỉ 20 và 21 không quan niệm hệnh tật theo khái niệm lưỡng phẫn đỏ, mả xem 
hệnh tật là một quả trình liên tục được thể hiện băng chỉ số nguy cử. Thuật ngữ 
risk và risk factar chỉ xuất hiện từ cũng trình nghiên cứu nổi tiếng Framingham 
Heart Study vào đâu thập niên 1950. Trước đỏ, y văn không có khải niệm risk. 

Khi nói “racture” (gäy xương) hay "cancer” (ung thư) chúng ta muốn nói đến 
một sự kiện chủ một cá nhân; nhưng khi nói đến “fracture risk” hay "“cancer risk, 
chúng ta nói đến nguy cơ xảy ra, nguy cơ phát sinh cho một cá nhân hay một 
quẩn thể. Xin nhắc lại, sự kiện khác với nguy cơ sự kiện. Thành ra, fracture khác 
với fracture risk, vì fracture là một sự kiện mang tính khẳng định (certainty}, 
củn fracture risk là một hiển số liên tục mang tỉnh hất định (uncertainty}. Tất cả 
chúng ta trong bất cử thời điểm nào đếu có nguy cơ bị bệnh; nhưng có người cỏ 
nguy cơ cao, có người có nguy cơ thấn. 

Trong y khoa, nguy cơ mắc hệnh thực chất là xác suất. Xác suất, như chúng 
ta biết, là một biến số giữa ñ và 1. Xác suất thực chất là tỉ lệ, tỉ số, và phần trăm. 
Dao đó, thuật ngữ risk trong y khoa có thể có nghĩa là nrabahility, pruaporiion, 
incilence, và pnrevalence. Từ đỏ, nguy cử hay risk có thể định nghĩa như sau: xác 
suất mắc bệnh trong một thời gian nhất định. 

Vỉ dụ 1: Znledronic acid và gãy xương. Trong một nghiền cửu về ảnh hưởng 
của zoledronic acid, một loại thuốc chống loäng xương và ngửa gãy xương [1], 
các nhà nghiên cửu tuyển chọn 7736 phụ nữ sau mãn kinh, tuổi từ 65 đến 89. 
Họ ngắu nhiên chia các đổi tượng nghiên cứu thành hai nhóm: nhỏm một gốm 
3875 bệnh nhân được điểu trị với zoledronate, và nhám hai gốm 3861 bệnh nhản 
trong nhóm đổi chứng không được tiêm zoledronate mả chỉ uống calcium và 
vitamin D (CaD, củn gọi là nhóm chứng). Sau 3 năm theo dõi, có 52 bệnh nhân 
trong nhỏm zoledronate và 88 bệnh nhãn trong nhóm chứng bị gãy xương hông 
(hip}. Kết quả cỏ thể tỏm lược trong Bảng Ì như sau. 
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Bảng 1. Số ca gấy xương thuộc nhóm zoledronic acid và nhóm chứng 
1 _#eledronicacid Nhóm chứng (CaD). 
¬ố nhụ nữ 31825 3ãũñl 
Số ca gầy xương hỗng 52 B8 


Với số liệu trên, chúng ta có thể ức tính nguy cơ gấy xương hỏng ở nhóm 
znledronate là 0.0134 hay 1.34%: 


Tương tự, nguy cơ gãy xương ở nhóm chứng là 0.0228 hay 2.28. Khái niệm 
nguy cơ sẽ được sử dụng rất nhiễu trang nghiên cửu lãm sảng. 


2. Khái niêm œdds 


Trong tiếng Anh còn có một danh từ mà các ngôn ngữ khác như Pháp, Tây 
Ban Nha, Đức, và ngay cả tiếng Việt cũng không cỏ: đó là ødds. Khải niệm œdds 
xuất phát từ... sỏng bái, dùng để mỗ tả khả năng biến cỗ xảy ra so với biến cổ 
không xảy ra. 


Cdds và xác suất có liên quan với nhau, và có thể định nghĩa ndds một cách 
chung như sau: Nếu xác suất bệnh nhãn mặc bệnh là p, thi cỏ một cách nói khác 
răng odds mả bệnh nhãn đó mắc bệnh so với không mắc bệnh lã: 

nddy =—P— 
l=p 

Trong ví dụ l trên, nguy cơ gầy xương hông ở nhóm zoledronate là 0.0134 
(tức 52/3875), do đó, odds gãy xương hông là: 

— 00134. 
_1-0/0134 

Như vậy, trong trưởng hợp này, odds và risk không khác nhau đáng kể. Tuy 
nhiên, nếu nguy cơ mắc bệnh cao, chẳng hạn như p = 0.40 thì odds = 0.67, rất 
khác nhau! Nói tảm lại, khi nguy cơ bệnh thấp, odds và risk rất ẩn nhau, nhưng 
khi nguy cơ bệnh cao (trên 0.3) thi giá trị của odds cao hơn risk. 


=1 0136 


3. Các chỉ số đo lường hiệu quả 


Các chỉ số đo lưỡng hiệu quả của can thiện trong nghiên cứu RCT cỏ thể chia 
thành hai nhóm: các chỉ số tuyệt đổi (absolute measures) và các chỉ số tương 


-83- 


đổi (relative measures). Chỉ số tuyệt đối phổ biến là absolute risk reduction vả 
numher needed to treat. Chỉ số tương đổi là risk ratio hoặc hazards ratio, odds 
raHo. Tất cả các chỉ số này đều được tính tuản trên cơ sở nguy cử và ndlÍs vừa giải 
thích trên đầy. 


3.1. Các chỉ số tuyệt đối 

Bãi với các biến làm sảng nhị phân (tức chỉ hai giá trị), hai chỉ số tuyệt đối 
thường hay được sử dụng để đánh giá hiệu quả của can thiệp là: 

s- Ahsolute risk reductHon (ÄRR hay giảm nguy cơ tuyệt đổi); và 

® Numher needed tù treat (NNT hay số bệnh nhãn cẩn điểu trị). 

3.I.1,ARR 

Xác suất mắc bệnh được xem là nguy cử tuyệt đãi. Trang nghiên cứu RCT có 
hai nhóm, thì chúng ta có hai xác suất (hay nguy cơ). Gọi p. là nguy cơ của nhóm 
chứng, vả p, là nguy cơ của nhóm điểu trị, ÄRE được định nghĩa đơn giản là hiệu 
số của hai nguy cơ: 

ARR=p,—p, HH 
Quay lại ví dụ về nghiên cứu zoledronic acid, 
Số ca gấy xương thuộc nhóm zoledronic acid và nhóm chứng 


_#eoledronicacid Nhóm chứng (CaD) 


5ö phụ nữ 3875 3861 

Số ca pầy xương hỗng "2 8ã 

Nguy cư gãy xương 0.013 0.023 
chúng ta có thể tính ARR như sau: 


ÄAEER =0.023 - 0.015 = 0.010 


Nói cách khác, so với nhóm chứng, zoledronate giảm nguy gẵy xương tuyệt 
đổi 1%. Cũng cỏ thể diễn miải cách khác, đỏ là xác suất thành công trong điểu trị. 

Kết quả 0.01 (hay 184) là một ước số của một nghiên cứu, và nghiên cửu nảy 
lấy mẫu tử cộng đẳng, cầu hỏi đặt ra là: nếu nghiên cứu nảy được lặp lại nhiều 
lần, và mỗi lần cũng lấy mẫu như thể, thi kết quả dao động ra sao? Chúng ta có 
thể dùng phương pháp thống kẽ để trả lời câu hỏi, bằng cách tính khoảng tìn cậy 
95% (KTCĐ95) của ARE. Để tính KTCĐ95, chúng ta cần phải ước tính sai số chuẩn 
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[5E - standard error]| cho ARR. (Có thể xem chương thống kẻ về cách tính, ở đây 
chúng ta chỉ trình bảy kết quả). Dựa vào kết quả trong bảng trên, sai số chuẩn 
của ÄRR là 


5E =0.005 
Và khoảng tin cậy 959¡ có thể tính dựa vào giả định phản bổ chuẩn: 
KTCĐ5 của ARRE = ARE+ 0.003 x 1.9 
= .ñ10 + 0.005 x 1.96 
= .004 đến 0.16 


Nói cách khác, nếu nghiên cửu lặp lại nhiều lấn ÀARR có thể dao động trang 
khoảng 0.4 ® đến 1.6 %ú. Tất cả KTIC95 đểu trên 0 (nếu bảng ÚŨ có nghĩa là không 
có hiệu quả), nên chúng ta có thể kết luận răng hiệu quả giảm gấy xương của 
zuledronic acid cả ý nghĩa thống kẽ. 

31.2 NNT 


ARR là chỉ số đơn giản, nhưng có khi khó hiểu, nhất là tấn số thấp. Trong ví 
dụ trên, không phải ai cũng có thể hiểu ý nghĩa của 1.6% là mì. Hay có hiểu thi 
cũn số quả nhỏ làm cho bệnh nhãn và bác sĩ cảm thấy... không quan tắm. 


Người thấy thuốc đổi phỏ với một trường hợp cá thể. Nói cách khác, chúng 
ta cẩn một chỉ số để có thể truyền đạt hiệu quả của thuốc cho một cả nhắn. Sau 
nhiễu năm nghiên cửu, các nhà nghiên cứu (Canada để ra một chỉ số mới có tên 
là number needed to treat (NINT) [23]. Có lễ nên dịch sang tiếng Việt là “Số 
người cần được điểu trị, nhưng để thống nhất với y văn quốc tế, tôi sẽ viết tắt là 
NNT để bạn đạc khỏi ngữ ngàng khi theo dõi các háo cáo y học quốc tế. Chỉ số 
này chỉ đơn giản là hảm số của hai nguy cơ tuyệt đối p, vả p: 

NNT = _ = =— [2] 
Pụ — Pì ARR 

Ý nghĩa của NNT là gì? Phần lớn y văn, như trang web của Tập san Briish 
Medical Jaurnal (http:/fwww.bmi.com/cgicontent/full/319/72253/1492), định 
nghĩa rằng “The nurnher dƒ nafients wha neerl ta he treated tn nrevenf ane adlditinnal 
evenf” (số bệnh nhãn cần được điểu trị để ngắn một ca bệnh). Nhưng định nghĩa 
đó... sail Thật ra, NNT là số bệnh nhân cần dược điều trị để mảm một ca hệnh. 
Chú ý. tôi dùng chữ giảm chứ không phải ngắn ngửa như nhiều bài báo trong y 
văn sử dụng sai. 


Nhin qua công thức trên chủng ta thấy nếu p, = p, hay ARR = ũ thi NNT là 
số vỗ định (vi không thể chia cho 0). Nói cách khác, nếu không có hiệu quả lầm 
sảng thì NNT là võ định. Nếu độ khác biệt giữa p, và p, (phần mẫu số) cảng cao 
thi NNT cảng thấp; và ngược lại, nếu độ khác biệt cảng thấp thi NNT cảng can. 
Điều này có nghĩa là nếu nguy cơ mắc bệnh cao, và nếu hiệu quả của thuốc cao 
(mảm nguy cử mắc bệnh nhiễu), thi chúng ta chỉ cẩn điều trị một số it bệnh 
nhân để giảm một trường hợp mắc bệnh. 


Vỉ dụ: Quay trở lại kết quả nghiên cửu znledronic acid, chúng ta có thể tiớc 
tính NNT như sau (chú ý răng ARR = 0.015}: 
= Ị — 

“nn" 


Nói cách khác, chúng ta cẩn điểu trị 100 bệnh nhản để giảm Ì ca gãy cổ 
xương đủi. Dĩ nhiên, zoledronic acid còn có hiệu quả khác như giảm nguy cơ gầy 
xương cột sống, giảm tử vong, và chúng ta có thể ước tính NNT cho mỗi biến 
cổ lắm sảng. Vì ý nghĩa đơn giản và dễ tỉnh toán, NNT là một trong những chỉ 
số được sử dụng rất nhổ hiến trong nghiên cứu RCT. Trong trưởng hợp nguy cơ 
mắc bệnh ở nhỏm điểu trị cap hơn nhóm chứng (tức can thiệp có hại), chủng 
ta vẫn có thể tính NNT, nhưng gọi là NNH - numher needed to harm (số bệnh 
nhắn cần thiết để tăng thêm 1 ca biến chứng). 


3.2. Các chỉ số tương đãi 


I0u 


Hai chỉ số tương đối thường được sử dụng để “do lưỡng” hiệu quả của một 
can thiệp trong nghiên cứu RCT: relative risk hay risk ratia (RR, tỉ số nguy cữ) và 
nrlds raiin (OR, tỉ số odds). Khi nguy cơ bệnh thấp (ví dụ như < 5%) thì OR rất 
tương đương với RR. 

3.3.1. Risk ratin 

Với hai nguy cơ, p, và p., RR được định nghĩ là tỉ số của nguy cơ thuộc nhóm 
can thiệp trên nguy cơ của nhóm chứng: 

RR=®+ [ị 
LÚ) 

Chú ý ở đây, chúng ta đặt nguy cơ của nhóm điểu trị (p,) lên tử số. Do đó, có 
3 trưởng hựn xảy ra: 

s Nếu RR < 1, chủng ta có thể nói nguy cơ mắc bệnh trong nhóm điểu trị 

thấp hơn nhỏm chứng (thuốc có hiệu quả); 
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« Nếu RR > 1, nguy cơ mắc bệnh trong nhỏm điểu trị cao hơn nhóm chứng 
(thuốc gãy thêm tác hại); và 

« Nếu RR = l cỏ nghĩa là cả hai nhóm có nguy cơ như nhau (tức thuốc 

không cỏ hiệu quả]. 

Bởi vì 1 là “giá trị tham chiếu” chủ nên nếu chúng ta lấy I trừ cho RR, chúng 
ta có một chỉ số mới: đỏ là giảm nguy cơ tương đỗi (relaiive risk reducHinn hay 
RRR]: 

RRR=1-RR [4| 


Vĩ dụ: Kết quả nghiên cứu zoledronic acid cho thấy p_ = 0.0228 và p. = 0.013, 
nên chúng ta có thể tính RR: 


RR = ĐUn _ ũ.57 
ú.023 


Chỉ số RR = U.57 có thể hiểu là nguy cơ gäy xương đùi ở nhỏm zoledronic 
acid băng 57% nhóm chứng. Nhưng chúng ta có thể tỉnh RRR = 1 - ñ.57 = ñ.43, 
và kết quả này cho biết so với nhóm chứng, zoledronic acid giảm nguy cơ gầy 
xương 43%. 


Câu hỏi kể tiếp là mức độ ảnh hưởng đó (giảm nguy cơ gãy xương) cỏ ý 
nghĩa thống kế? Để xác định cỏ ý nghĩa thống kê chúng ta có thể tính toán trị 
số D Nhưng một cách khác có nhiễu thông tin hơn là tính toán KTC95. Để tính 
toán KTCS5 của một RR, cần phải làm vải thao tác đại số (tôi sẽ miải thích trang 
chương về thống kẻ), còn ở đây, KTCS5 là: 


(0.42 đến (I.83 


Trong y văn, người ta thường hay viết RR = 0.57 (KTCS95 0.42 đến 0.83). Nếu 
RR = l1, chúng ta có thể hiểu răng zoledranic acid không có hiệu quả giảm nguy 
cơ gảy xương. Kết quả trên cho biết nếu chúng ta lặn lại nghiên cứu 100 lần, 
thi 95 nghiên cứu sẽ có RR dao động trong khoảng 0.42 đến 0.83. Với giả định 
“mạnh”, cũng có thể diễn giải kết quả trên như sau: xác suất 95% là RR dao động 
trong khoảng ũ.42 đến 0.83. Vì 95% RR đếu dưới 1, chúng ta cỏ lí do để nói rằng 
hiệu quả của thuốc cỏ ý nghĩa thống kẻ. 


Qua ví dụ trên, chúng ta có thể thấy hai loại thuấc có cùng RR không hẳn có 
nghĩa là có hiệu quả như nhau, vì chúng ta không biết nguy cơ tuyệt đối là bao 
nhiều. Chỉ số RR rất thông dụng trang các bảo cáo nghiên cứu y khoa, nhưng 
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cũng từng được phẻ hình rất nhiều lần. Tuy nhiên, vì tính đơn giản của nó, nên 
chỉ số RR vẫn thường được sử dụng để đánh giả hiệu quả của một thuật điểu trị. 

Như nói trên, RR là một đo lưững mang tỉnh quân thể, chứ không phải cá 
nhắn. Khi nói RR = 0.4 hay thuốc giảm nguy cơ mắc bệnh 60% là nói đến hiệu 
quả của thuốc chu một quần thể, bởi vi cả tử số và mẫu số của RR như chúng ta 
thấy là tỉ lệ, mả tỉ lệ phản ảnh quấn thể. 


Một ghi chú về RR và ARR 


Có thể nói răng RR là chỉ số phổ biến nhất trang các nghiên cứu RCT vả các 
công ty dược thích dùng RR vi nó dễ cho ra một kết quả "ẩn tượng” hiểu một 
nghiên cửu với kết quả nguy cơ ở nhỏm can thiệp và nhỏm chứng là 0.001 và 
0.002 (tức rất thấn), chúng ta có thể tỉnh: 


= XEE = 0.001 - 0.002 = -1.001 
ø RE = 0.001 / 0.002 = 0.50 
Trang cách tính ARR, thuốc chỉ giảm 1.1% nguy cử mắc bệnh. Nhưng nếu 
dùng RR, nhà nghiên cứu có thể nói thuốc giảm nguy cử mắc hệnh đến 50%! Do 
đó, RR có thể biến một nguy cơ tuyệt đối rất thần thành một nguy cơ tương đổi 
rất can. 
Một vẫn để khác của RR là có thể dẫn đến hiểu lắm. Thử xem qua hai trường 
hợp dưới đây: 
s Miột nghiên cứu hiệu quả thuốc Ä cho thấy nguy cơ mắc bệnh ở bệnh 
nhãn nhóm Ì và nhóm 2 là 0.ũI và 0.02 (tức 1% và 29%). Tỉ số nguy cơ, do 
đó, bằng: RR = 0.01 / 0.02 = 0.50. 
s_ Một nghiên cứu khác cũng cỏ hai nhóm, nhưng lần này. nguy cơ mắc hệnh 
trung cộng đồng tăng lũ lẩn so với nghiên cứu trên, với tỉ lệ mắc bệnh ở 
hai nhỏm là Ú.10 và 0.30 (108 và 20). Tỉ số nguy cơ vẫn RR = Ö.5. 


Do đỏ, nếu chỉ nhìn vào RR chúng ta nghĩ hiệu quả như nhau, nhưng trong 
thực tế đây là hai quần thể rất khác nhau. Nghiên cứu đấu có nguy cư thần hưn 
nghiên cứu sau. Do đỏ, nếu chúng ta không biết nguy cơ trong cộng đẳng (p,), 
mả chỉ biết RR thi rất dễ bị hiểu lầm. RR không cung cấp cho chúng ta một bức 
tranh đấy đủ. 
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3.3.2. Odds ratia 

Chúng ta đã làm quen với khái niệm œdds. Tï số odds (thường viết tắt là OR} 
thưởng được dùng để đánh giả mỗi liên quan trong các nghiên cứu bệnh chứng, 
nhưng cũng được dùng trong các nghiên cứu RCT. Tï số odds, như tên ám chỉ, là 
tỉ số của hai œdds. Quay lại nghiên cứu zuledronic acid, chúng ta có thể tỉnh adds 
gãy xương của nhóm can thiệp (kí hiệu O1) và nhóm chứng O, như sau: 


Số ca mấy xương thuộc nhóm zoÏledronic acid và nhóm chứng 
| Znledrusicaril Nhómchứng(CaD) 


| Số phụ nữ 3875 386] 
5ỗ ca gẩy xương hồng 5 88 
Nguy cơ gầy xửững .013 0.023 
ChNlds gãy xương 0.0132 (0235 


T¡ số odds được tính như là tỉ số của Ø, trên ØÖ: 
Ø, 00132 
_y 00235 
Cũng tương tự như trưởng hợp RR, OR cũng có thể diễn giải theo 3 tỉnh 
huống: 
« Nếu ÖR < 1, chúng ta có thể nói œdds mắc bệnh trong nhóm điểu trị thấp 
hơn nhóm chứng (thuốc có hiệu quả); 
« Nếu OR > 1, odds mắc bệnh trong nhóm điểu trị cao hơn nhóm chứng 
(thuốc gãy thêm tác hại); và 


« hiểu HH = l có nghĩa là cả hai nhỏm có adds gấy xương như nhau (tức 
thuốc không cỏ hiệu quả). 


ðR 


=0.56 [5] 


Trong ví dụ trên, có thể diễn giải rằng zoledronic acid giảm odds gãy xương 
429i (so với nhóm chứng). Nhưng cầu hỏi đặt ra là mức độ ảnh hưởng đỏ có 
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ý nghĩa thống kê. Để trả lời câu hỏi này. cẩn phải ước tính khoảng tin cậy 959ù 
(xem phương pháp tỉnh ở chương thống kê). Qua tỉnh toán chúng ta có kết quả 
KTCSS5 dao động từ 0.41 đến 0.82, tức là một cách nhất quản dưới 1. Do đỏ, có 
thể kết luận răng ảnh hưởng của zoledranic acid là có ý nghĩa thống kẻ. 


3.3. Tỉ số rủi ru (hazardl ratia) 


Một chỉ số khác cũng hay được hảo cáo trong các nghiên cứu RCT: đó là 
hazard ratio (HR). Như tên gọi, HR là tỉ số của hai hazard: hazard của nhóm can 
thiện và hazard của nhóm chứng. Trong thực tế, HR rất tương đương với RR; da 
đó, các nhà nghiên cứu thưởng diễn giải HR như là RR. 


Tuy nhiên, để hiểu HR, chúng ta cẩn phải hiểu khải niệm hazard (tạm dịch là 
rủi ru). Để hiểu khái niệm hazard chúng ta cẩn phải làm quen với biểu đổ sống 
củn - swrviwal curve. Trong biểu đỗ sỗng củn, trục tung thưởng là xác suất tích 
lũy sống sút (cumulative survival pnrobahility), và trục hoành là thời gian. Biểu 
đỗ dưới đây mô tả xác suất sống còn của hai nhóm bệnh nhân. Chẳng hạn như 
thời điểm tuần thử 10, khoảng 40% bệnh nhän nhóm chứng củn sống, nhưng 
gần 80 nhỏm điểu trị củn sống. Nói cách khác, xác suất tử vang ở nhóm điểu 
trị thấn hơn nhóm chứng. 


Một cách ngắn gọn: hazard là độ đốc (slope} của đường biểu điễn sống còn. 
Như vậy, haznrd nhân ảnh tốc độ tử vang của bệnh nhẫn. Trong ví dụ trên, ở bất 
cử thời điểm nào, độ dốc của nhóm chứng đểu cao hơn độ dốc của nhóm điểu trị 
4.8 lần. Nói cách khác, độ dốc nhóm điểu trị chỉ bằng Ú.21 độ đốc nhóm chứng. 
Con số 4.8 (hay 0.31) chỉnh là HR hay tỉ số rủi ro. 
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Nhưng như đã để cặp trên, trong thực tế, HR rất giống như RR. Do đó, hai 
chỉ số này thưởng được diễn giải như nhau. 


3.4. Diễn giải khoảng tìn cậy 95% 


Chúng ta hay thấy trong y văn có thuật ngữ “conlidence interval” mả tôi tạm 
dịch là “khoảng tin cậy”. Thông thường, các nhà nghiên cứu bảo cáo kết quả 
hãng tỉ số nguy cơ và kèm theo khoảng tin cậy 959i (KTCĐS5). Vấn để đặt ra là 
KTCS5 có nghĩa gì? Nếu KTCS5 của một thông số dao động trong khoảng ä đến 
h, nhân lớn độc giả hiểu rằng xác suất 95% là thông số đó dạo động trong khoảng 
a đến b. Nhưng theo lí thuyết cách hiểu đó sai, vì đó là xác suất theo trưởng phải 
Bayes (xem Chương 1). Trong thực tế, ý nghĩa của KTC hơi khó giải thích và 
khó hiểu. Trong hình dưới đây, chúng ta có 100 KTC95 của thông số u được tỉnh 
tử 1ŨŨ mẫu (lấy từ một quần thể). 


Chủ ý rằng các KTC95 khác nhau về chiểu rộng và vị trí trung bình, vì dao 
động ngẫu nhiên. Nhưng tỉnh trung bình, 95% KTCS5 đó sẽ bao gốm giá trị thật 
của thông số . Như vậy, ý nghĩa thật của KTCS5 phức tạp hơn chúng ta tưởng! 
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Nhưng ở đây, tôi muốn cung cấp một cách điễn giải có liên quan đến ý nghĩa 
lãm sảng. Điều rất quan trọng là cẩn phải phản hiệt một kết quả có ý nghĩa lắm 
sàng và một liết quả có ý nghĩa thống kê. Cá ý nghĩa thống kẻ ở đây là trị số P < 
(I.05, hoặc khoảng KTCS5 của RR không bao gắm 1. Chẳng hạn như khi KTC95 
là 0.75 đến 0.90, chúng ta có thể nói là “có ý nghĩa thống kể”, nhưng nếu KTCS5 
dao động từ 0.BŨ đến 1.10, chúng ta nói kết quả không có ý nghĩa thông kẻ. 


Có ÿ nghĩa lãm sàng thì khó xác định hơn. Tuy nhiên, điểm cần nhấn mạnh 
ở đây là một kết quả có thể có ý nghĩa thống kê, nhưng hoàn toàn không có ý 
nghĩa lâm sảng. Chẳng hạn như nếu kết quả nghiên cứu cho thấy thuốc À giảm 
nguy cơ gầy xương cột sống trong khoảng ñ.1 đến I.5% (và có ý nghĩa thống kế), 
nhưng một kết quả như thế khỏ có thể xem là có ý nghĩa lắm sảng. Trong loãng 
xương, phần lửn các chuyên gia đồng ý rằng nếu can thiệp giảm nguy cử gẩy 
xương (tương đối) 30% trử lên được xem là có ý nghĩa lắm sàng. Da đó, để diễn 
giải KTCĐ95, chúng ta cẩn phải: 


s Xác định ngưỡng RR có ý nghĩa lãm sảng; 
s Xác định giả trị RR của nghiên cứu; và 
s_ Đi chiếu với ngưỡng cỏ giả trị lãm sảng. 


Biểu đỗ dưới đây mình họa cho ý tưởng trên. Risk ratio = 1 là cột tham chiếu. 
Vũng không có ý nghĩa lãm sảng được thể hiện bằng màu trắng (ở giữa). Vùng 
mảu xám (hên trải) (RR < 1) là giảm có ý nghĩa lãm sảng. Vùng máu xảm (bên 
phải) (RKR > 1) là thể hiện “có hại” Chúng ta có một số tình huống như sau: 


Củ Ích đẳng Củ Hạt 


Ñ. Có hại 

B. Có thể có hại 

£. Khỏ kết luận 

D. Không đẳng kể 

E. Không đáng kể 

F. Không đắng kế 

G. Không đáng kể 

H. Có thể có hiệu quả l.s 
| 1, Cả hiệu quả lắm sàng 
| 1. Không kết luận được 


Risk ratio [tỉ số nguy cơ] 
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Á: kết quả cho thấy RR > 1, có ý nghĩa thống kẻ (vì không băng ngang trục 
tham chiếu RR = 1), và tác hại có ý nghĩa lãm sàng vì KTC95 năm trang 
vùng mảu xám (bên phải); 

s« B: kết quả cỏ ý nghĩa thống kẻ, và tác hại nhưng vì phần dưới KTC95 năm 
trong vùng mảu trắng (không có ý nghĩa lắm sảng), nên liết quả này có thể 
diễn giải là rất có thể có tác hại. 

« C: kết quả này khỏ kết luận vì không có ý nghĩa thống kê, nhưng vì nhân 
lớn KTC95 năm trong vùng cỏ hại, nên có thể diễn giải là có thể gây tác hại. 

s .D: kết quả không có ý nghĩa thống kẽ, KTCS5 vắt ngang gẩn bằng nhau giữa 
vùng mảu trắng và máu xám (bên phải), nên không thể kết luận về tác hại. 

s« E: kết quả có ý nghĩa thẳng kê và rất nhất quản, tuy nhiên vi KTC năm 
trang vùng mảu trắng. nên cỏ thể kết luận là không có ý nghĩa làm sảng. 

s« E: kết quả không có ý nghĩa thống kẻ, và cũng không có ý nghĩa lãm sảng. 

s«G: kết quả không có ý nghĩa thống kẻ, nhưng nghiễng về nhân có lợi. Tuy 
nhiên, một nhân lớn của KTC95 năm trong vùng mảu trắng. Do đỏ, có thể 
kết luận “có lợi nhưng có thể không có ý nghĩa lãm sảng” 

s« H: cỏ ý nghĩa thống kẻ, KTC95 nằm trong vùng có lợi những một phân 

nằm trong vùng mảu trắng, nên có thể diễn giải là can thiệp có thể có ích 

cho bệnh nhãn. 


« I: kết quả cỏ ý nghĩa thống kẽ. Phần trên và dưới của KTC95 đểều năm 
trang vùng mảu xám (hên trải). Do đả, có thể kết luận đây là chứng cử 
thuyết phục cho thấy can thiệp đem lại lợi ích cho bệnh nhân. 

s« ]: không thể kết luận gì được. KTC95 quả rộng, là tín hiệu cho thấy cũ mẫu 
của nghiên cửu, hay số biến cổ (œutcome) của nghiên cửu, rất nhả. 


Khi một kết quả không cỏ ý nghĩa thống kẻ thi điểu đó chưa phải là chứng 
cử để nói can thiệp không có hiệu quả. Người phương Tây có câu “ Absenre nƑ 
Evidlence is nút evidence nƒ ahsence” (nỗi một cách chơi chữ: uẵng mặt bằng chứng 
không cú nghĩa là bằng chiững của sự vẳng mặt}. Một can thiệp với kết quả không 
có ý nghĩa thống kê (thiểu chứng cử) không có nghĩa bàng chứng [cho thấy| can 
thiệp không có hiệu quả. Rất có thể nghiên cứu được thiết kế chưa tốt, cử mẫu 
quá thấp, nên không có kết quả có ý nghĩa thống kẻ. Nhưng với KTC95 như 
ũ.97 - 1.03, chúng ta có thể nói là có bằng chứng cho thấy không có hiệu quả vì 
không cỏ ý nghĩa thống kẻ và KTC95 rất hẹp, cho thấy kết quả nhất quản. 
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Tám lại, khoảng tin cậy, mả đặc biệt là khoảng tin cậy 95%, là một chỉ số 
thống kê rất có ích cho chúng ta, vì nỏ cung cấp những thông tin để chúng ta đặt 
trong bối cảnh lãm sảng. Khi diễn giải kết quả nghiên cứu, không nên quả quan 
trọng hỏa trị số E, bởi vị, như nói trên, một kết quả cỏ thể cho ra P < 05 nhưng 
không có # nghĩa thống kẻ. 

3.5. So sánh các chỉ số 


Bảy giờ chúng ta thử áp dụng công thức [1 | đến |4] để tôm tắt ba nghiên cứu 
trong bảng số liệu sau đây: 


So sánh các chỉ số đo lường hiệu quả làm sảng 


Nưunianaau00] 1H | 18 | 8 — 
Ng cơ nhóm chứng (®) —= 


Ghi chủ: Ä 1 = ahsnlurir risk reidlnrfian; I3 = rrlalive risk reductinn; NT = namnhpr needeidll In IrealL 


So sánh bằng nguy cơ tuyệt đổi, chúng ta thấy răng hiệu quả lãm sảng giữa 
zuledranate và risedronate rất giống nhau: cả hai thuốc miẳm nguy cơ gấy xương 
hông khoảng Ú.94% (zoledronate) đến 1.17% (risedronate). Nhưng chúng ta 
không thể nói rằng risedronate có hiệu quả hơn zoledronate, bởi vi nguy cơ 
gầy xương trong nhóm chứng của nghiên cửu risedronate cao hơn so với nhóm 
chứng của zoledronate, chứng tỏ hai quần thể khác nhau. Thật vậy, các đối 
tượng trong nghiên cửu risedronate là những phụ nữ cao tuổi hơn và có nguy 
cử gầy xương hỗng cao hơn các phụ nữ trong nghiền cứu zoledronate. Tương 
tự, chúng ta không thể nói rằng pravastatin có hiệu quả cao hơn zoledronate 
hay risedronate hởi vì (a) hai loại bệnh khác nhau; (h} hai nhóm đối tượng khác 
nhau: nam và nữ, khác tuổi, khác tiêu chuẩn lắm sàng; và (c} nguy cơ nhối máu 
cư tim cao hơn nguy cơ gấy xương hồng. 
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Chúng ta không so sánh trực tiếp bằng ARR, thể củn RRR — giảm nguy cơ 
tương đổi Nguy cơ tương đổi cung cấp cho chúng ta một chỉ số hấp dẫn hơn 
ARR, nhưng vẫn chưa hẳn công bằng. Dựa vào kết quả tính toán trong bảng 
trên, chúng ta có thể nói rằng hiệu quả lãm sảng của zoÌledronate vả risedronate 
tương đương nhau (RRR = 41 và 43). 


Nhưng cỏ thể xem mức độ giảm nguy cơ của pravastatin (31%} có hiệu quả 
thấp hơn hai thuốc chẳng loäng xương hay không? Theo tôi, cầu trả lời vẫn là 
“không”. Ngoài ba lí do nêu trên, chủng ta côn có một lí do khác là nguy cơ trong 
quấn thể rất khác nhau. Giảm nguy cơ bệnh từ 20% xuống 109 (tức là RR = Ú.5) 
có thể có ý nghĩa hơn là giảm nguy cơ Ú.1% xuống còn (05% (tức RR vẫn bằng 
ũ.5). Nhưng nếu chỉ dựa vào RR chúng ta có thể hiểu lắm rằng hai ảnh hưởng 
hãng nhau, vì RR không cung cấp cho chúng ta biết mức độ nguy cơ trong quân 
thể. Diễn dịch RR, nói cách khác, cần phải biết nguy cơ trong quần thể. 


Do đả, chỉ số còn lại có thể sử dụng để so sánh tương đối công băng (hay 
khách quan) hơn hai chỉ số trên là NNT. Trong 3 nghiên cứu, số NNT cha 
zoledronate là 106, risedronate là 85, và pravastatin là 45. Các con số nảy cỏ 
nghĩa gi? Nói một cách ngắn gọn, can số NNTT này có nghĩa là: với trường hợp 
pravastatin, tính trung bình, chúng ta phải điểu trị 45 bệnh nhãn để giảm một ca 
nhi máu cơ tim so với nhằm chứng (không điểu trị). L[Hiễn giải một cách tương 
đối dải hơn thi NNT có nghĩa như sau: 


Giả dụ chúng ta điểu trị 100 bệnh nhãn (nam với cholesterol cao). Trong số 
này, 93 người sẽ không bị bệnh nhối máu cơ tim (vì tỉ lệ mắc bệnh trong nhóm 
chứng là 7.5%, nhưng tôi làm chắn 7%). Năm người củn lại sẽ mắc bệnh dù được 
điểu trị với statIn (vì tỉ lệ mắc bệnh trong nhóm statin là 5.3%, nhưng một lần 
nữa tôi lấy chắn 5%}. Số còn lại 2 người sẽ không mắc bệnh. Như vậy, trong số 
1Ù người được điểu trị, chúng ta ngăn ngừa được 2 bệnh nhân khỏi bệnh — 
trong vòng 5 năm. Nói cách khác, chúng ta phải điểu trị 5 người để thấy hiệu 
quả cho l người (thật ra con số là 45, nhưng vì tính chăn nên thành 50). 

Trong trưởng hợp zoledronate và gấy xương hồng, vì tỉ lệ (nguy cơ) gãy 
xương thấp, nên tôi sẽ lấy 1000 trưởng hựp để diễn giải hiệu quả của thuốc. Then 
hảng trên, nếu 1000 phụ nữ loäng xương được điểu trị bằng zoledronate, sẽ cỏ 
877 người không hị gấy xương hỗng (1000 trừ cho 2.3% trong nhỏm chứng). Tï 
lệ gãy xương trang nhám điểu trị là 1.3%, cho nên sẽ có 13 người bị gãy xương 
hông dù được tiêm zoledronate. Số 1Ũ người còn lại sẽ không hị mấy xương. 
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Do đó, cứ 1000 bệnh nhắn được điểu trị trong vòng 3 năm, chúng ta giảm được 
LŨ ca gãy xương hồng. 


Theo tôi, đỏ là cách diễn giải dễ hiểu nhất để chủ bệnh nhẫn hiểu được hiệu 
quả của thuốc. Nhưng rất tiếc không sách giáo khoa nào mỗ tả như thể, và 
cảng tiếc hơn khi phần lớn y văn đếu mỗ tả hiệu quả lâm sảng qua tỉ số nguy 
cơ. Chẳng hạn như trong ví dụ trên, các nhà sản xuất thuốc sẽ nói (và đã nói) 
răng statin niảm nguy cứ nhối máu cơ tìm 31%. Con số 319 thoạt đấu nghe rất 
ấn tượng, nhưng nếu đặt nó vào bối cảnh của một cá nhân bệnh nhãn thì hoàn 
toàn... vỗ nghĩa. Nó vỗ nghĩa hởi vì một cá nhẫn thi không có mẫu số, nhưng 
RR lại là một phản số! Nó vô nghĩa vì RR áp dụng cho một quân thể, còn bệnh 
nhãn lä một cả nhắn. 

3.6. Mãi liên quam giữa các chỉ số 

Tất cả các chỉ số tuyệt đối và tương đổi, từ AIRCR, NNT đến RR và OR, đếu dựa 
trên hai xác suất p, và p,. Do đó, chúng đểu có liên quan với nhau về mặt toán. 
Nếu chúng ta biết p và RR, thì NNT có thể ước tính một cách đễ đàng: 

l 
Pa(1—RR) 

Nhưng nhìn qua công thức trên chúng ta dễ dàng thấy khi RR cảng thấn (tức 
hiệu quả lãm sảng cảng cao) thi số NNT cảng thấp, tức số bệnh nhân cẩn được 
điểu trị ít hơn để giảm thiểu một ca bệnh. Chẳng hạn như nếu tỉ lệ mắc bệnh 
trong nhóm chứng là 10% Íp, = 0.1) và qua y văn chúng ta biết rằng thuốc .Ä có 
hiệu quả lầm sảng giảm nguy cơ bệnh với RR = 0.5, chúng ta có thể ước tỉnh 
NNTT qua công thức trên như sau: 

l 
_II-05)- 

Bảng số liệu và biểu đổ sau đây sẽ tính NNT cho một số nguy cơ và các giá 

trị RR: 


Số bệnh nhân cần điểu trị tính cho nguy cơ bệnh 
tử 1% đến 20% vả tỉ số ð nguy Cử mem.-khlisdo 1 đến 0.9 
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Biểu dã thể hiện mổi liên hệ giữa RR [trục hoành] và MMT [trục tung] 
cho từng nguy cơ mắc bệnh 1%, 5%, 11% và 20%. Ở mỗi mức độ nguy cơ, 
tỉ số nguy cơ tương dối (RR] thấp, tức hiệu quả lãm sàng cao, số NNT cảng thấp; 
và ở mỗi RR, nguy cơ bệnh càng thấp, NMT cảng cao. 

Tám lại, trong ba chỉ số hiệu quả lãm sảng của một thuật điểu trị - niảm nguy 
cơ tuyệt đối ARR, giảm nguy cơ tương đổi RRR, và số bệnh nhân cần điểu trị 
NNT - thi NNT là chỉ số có ý nghĩa nhất và cẩn được sử dụng rộng rãi để truyển 
đạt thông tin y khoa đến bệnh nhãn. Không có một chỉ số lâm sảng nào hoàn 
hảo. Ngay cả NNT cũng có vài khiếm khuyết kỉ thuật của nỏ [5], nhưng cái tỉu 
điểm của nó là chỉ số này cho chúng ta một thông tin cẩn thiết cha người bệnh. 
Người thấy thuốc quan tâm đến một cá nhãn, và y học đang tiến dẫn từ quân 
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thể đến cá nhân, do đó NNTT sẽ trở thành một chỉ số làm sàng quan trọng trong 
tương lai. 


Để kết thúc, tôi muốn kể các bạn một câu chuyện khá tương quan giữa điểu 
trị vả... cướp ngắn hàng [6]. Trong những người cướp ngắn hàng nổi tiếng vào 
thập niên 1940 bên Mĩ là Willy Sutton. Khi ông ta bị bắt và được hỏi tại sao ông 
ta cử nhằm vàn ngắn hàng mả cướp, ỗng ta thản nhiên nói “vì tiến nằm ở đó” [6]. 
Đương nhiên. Tuy nhiên, trong chẵn đoán y khoa và điều trị bệnh, hàm ý cầu nói 
đó rất quan trọng. Nói chính xác hưn là thể này: nếu muốn đem lại lợi ích tối đa 
cho hệnh nhẫn, cẩn phải tìm bệnh nhân cỏ nguy cơ mắc bệnh cao. Biểu đỗ trên 
cho chúng ta thấy điểu nảy. Bệnh nhản có nguy cơ cao, điểu trị sẽ đem lại lợi ích 
lớn chẳng những cho cá nhân mả còn cho cộng đẳng. NNT giúp cho chủng ta 
chọn lựa nảy. 
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KHÁC BIỆT GIUA 0DDS RATI0 
VÀ RELATIVE RISK 


(RR) trong nghiên cứu RCT. Trang chương nảy, chúng ta sẽ bàn kỉ về 

ý nghĩa của các chỉ số nảy. Nhiều bải hán nghiên cứu y học lúc thì báo 
cáo OR, lúc thi RE. Vậy phân biệt hai chỉ số này như thể nào? Rất nhiễu nhà 
nghiên cứu, dù đã công bố bảo cáo khoa học trên các tập san danh tiếng như 
New Englandl laurnal nƑ Miedicine, vẫn hiểu sai - có khi cực kì sai lắm - về hai chỉ 
số này. Chương này sẽ giải thích những khác hiệt quan trọng của hai chỉ số đả. 
Tôi hi vọng rằng qua chương nảy, bạn đọc sẽ nắm vững vấn để hơn và phần biệt 
những khác biệt căn bản của hai chỉ số để không vấn phải những sai lắm như các 
nhả nghiên cứu y học trên thể giới từng phạm phải. 


Em Chương 5, chúng ta đã xem qua odds ratio (OR} và relative risk 


I.H và RR: cơ chế tỉnh tuán 


ÖR và RR là hai chỉ số thống kẻ rất nhố biến và có ích trong dịch tế học, vì cả 
hai chỉ số kiểm định mỗi liên hệ giữa một yếu tổ nguy cơ vả bệnh tật - một mục 
tiêu mẩn như căn bản của nghiên cứu y học hiện đại. Cơ chế tính toán của hai chỉ 
số này cực ki đơn giản. Bảng sau đây mô tả kết quả của một nghiên cứu đoàn hệ 
gồm hai nhóm đổi tượng. 


S ca gãy xương thuộc nhóm zoledronic acid và nhóm chứng 


Nhỏm phơi nhiễm Nhám chứng 
»ố đối tượng _š H, 
xũ mắc bệnh k, k. 


RE: Nếu trong một nhóm mm bệnh nhân bị phơi nhiễm một yếu tố nguy cơ 
(chẳng hạn như hút thuốc lá), và sau khi theo đỗi trong một thời gian, có k, đối 
tượng mắc hệnh, thi nguy cử mắc hệnh đưn giản là %L (hãy gơi tỉ lệ này là m, ). 
Nếu một nhóm chứng có n, bệnh nhân, và trong Bì thời gian theo dõi có k, 
bệnh nhãn mắc bệnh, thì tỉ lệ mắc bệnh là p, = 5b . Do đá, RR đơn giản là tỉ số 
của hai nguy cơ: = 

RR=“h [I| 
P: 

Nếu RR > 1 (hay m > m). chúng ta có thể phát biểu răng phưi nhiễm làm 
tăng khả năng mắc bệnh; nếu RR = 1 (tức là p, = p, }, chúng ta có thể nói rằng 
không có mỗi liên hệ nào giữa yếu tổ nguy cơ và khả năng mắc bệnh; và nếu RR 
< l (tức m,< m), chúng ta có bằng chứng để phát biểu răng phơi nhiễm làm 
giảm khả năng mắc hệnh. 

OR: Thay vì sử dụng tỉ lệ phát sinh p để đa lường khả năng mắc bệnh, thống 
kê cung cấp cho chúng ta một chỉ số khác: đó là œđddš, Chdds được định nghĩa là tỉ 
số của hai xác suất. Nếu p là xác suất mắc bệnh, thì 1 - p là xác suất sự kiện không 
mắc bệnh. Theo đó, adds được định nghĩa bằng: 

P 
“1z BH 

Như vậy, nếu odds > 1, khả năng mắc bệnh cao hơn khả năng không mắc 
bệnh; nếu dd = I thi điểu này cũng củ nghĩa là khả năng mắc bệnh bằng với khả 
năng không mặc hệnh; và nếu œdds < 1, chúng ta có thể nói khả năng mắc bệnh 
thấp hơn khả năng không mắc hệnh. 


Với định nghĩa này, chúng ta quay lại với vỉ dụ vừa trình bày trong mục RR. 
dds mắc bệnh trong nhỏm hị phơi nhiễm yếu tổ nguy cũ là: œÝ, = h 
adds mắc hệnh trong nhém không hị phơi nhiễm yếu tổ nguy cơ là: 
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Từ đó, OR được định nghĩa là tỉ số của hai adds: 


/{I—p,| 
oa~-./H~P) tị 
P; !ÍI— P;} 1— 
(Hay nếu ai thích đại số, OR có thể viết lại mọn hơn: 0R=T TT x—, 
1 + 


Mỗi liên hệ giữa RR và OR. Qua công thức [|], [2| và [3], chúng ta có thể 
thấy OR và RR có một mỗi liên hệ số học. Có thể viết lại cũng thức RR như là 
một hảm số của Ô1R (hay ngược lại), nhưng ở đây, tôi chỉ muốn lu ý một điểm 
quan trọng có liên quan đến việc diễn dịch RR và ÖR. 

Nhin vàn cũng thức [3| của ñdds, chủng ta đễ dàng thấy nếu tỉ lệ mắc bệnh p 
thấp (chẳng hạn như (1.001 hay 0.01 - tức 0.1% hay 1%), thì odds = p. Chẳng hạn 
như nếu p = ũ.Ũ1, thi Ì - p = Ũ.99, và do đó odds = Ú.01 7 0.89 = 0010101. Quay 
lại với công thức [5], nếu m, hay Ø, thấp, thi OR có thể viết như sau: 

oa-.P/Ñ~PB) „PL lay 
mI(—P) 

Nói cách khác, nếu tỉ lệ mắc bệnh thấp, thi ŒR gắn bằng với RR. Nhưng 
nếu tỉ lệ mắc bệnh cao (chẳng hạn như trên 10%) thì chỉ số ŒR cũng cao hơn 
chỉ số RR. 

Có thể làm một vải tính toán để thấy sự khác biệt giữa RR và OÖR qua bảng 
số liệu sau đây (Bảng 1). Với những trường hợp tỉ lệ mắc bệnh dưới 51%, R và 
RR không khác nhau đáng kể. Nhưng nếu tỉ lệ mắc bệnh cao hơn 10%, thì OR 
thường ước tỉnh RR cao hơn thực tế. 


Bảng 1. So sánh RR và OR với nhiều tỉ lệ khác nhau (số liệu mô phỏng) 
| | $o sánh giữa 


Nguy cư mắc bệnh (hlds mắc bệnh 


[ấm | %5 | ðm | o8 | 3 | â— 
[§s | Sm | am | ứm [3 | 35— 


~ 1ÚI - 


Chủ ý: Bảng trên đây được mỗ phỏng sao cho RR = 3 để chứng minh rằng 
HH ước tỉnh độ ảnh hưởng cao hơn so với thực tế. 


2. RR và OR: ng dụng 


Vỉ dụ 1: Truy tìm ung thư vú. Chương trình truy tìm ung thư vú được 
khuyến khích như là một phương cách y tế công cộng nhăm giảm tỉ lệ tử vang 
tử bệnh nảy ở phụ nữ. Một nhằm nghiên cứu ở Thụy Điển tiến hành một nghiên 
cứu lãm sảng đổi chứng ngẫu nhiên, mả trong đỏ họ tuyển các phụ nữ tuổi 50 
trở lên, và chia thành hai nhóm: nhằm Ä gốm 66 I3 phụ nữ được chụp X-quang 
(tức mammopraphy} thưởng xuyên (cử mỗi năm một lẳn), và nhóm B gốm 
66105 phụ nữ không chụp X-quang mà chỉ theo dõi bình thưởng (tức nhóm đối 
chứng). Sau 5 năm, nhóm À có 183 người chết vì ung thư vủ và nhóm B cỏ 177 
người chết. Số liệu được trinh hảy trong Bảng 2 sau đầy. 


Bảng 2. Truy tìm ung thư vú và tử vong 


NHm — | Mdfmeptameh 
A-Xam | S8 |. 1 


Với số liệu này, chúng ta có thể thấy nguy cơ tử vong trong nhóm À là 
Pạ =183/ 66103 = (0002768 và nhóm B là nu =l77/66105 =0.002678. Từ đả, 
RR có thể ước tỉnh bằng công thức [1] như sau: 

h ñ.002708 
ñ.00267ã 

Nhưng thay vì tính RR, chúng ta cũng có thể tính OR. Ođđs tử vàng trong 

.002768 ˆ | 
r£ “1-oooa2es - 0002776 , và nhóm đối 


chứng: øddy, — Pp„ _ 0002678 _ ñ.002685. Do đá, CH lã: 
I—py„ 1-0002678 


=I.01314 


nhỏm mammonraphy là: œddt:, = 
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oddy, (002776 
O(R=——^=—————-I(4 
oddy,  (L0026R5 


Như vậy, OR bằng RR. Nhưng cách diễn dịch của OR khác với RR. Bởi vì 
đơn vị của RR là nguy cơ tử vung, cho nên chúng ta có thể nói rằng nhỏm chụp 
mammonpranhy thưởng xuyên có nguy cơ tử vong cao hơn nhóm đổi chứng 
khoảng 3,4M. Nhưng đơn vị của ÖR là odds, cho nên chúng ta không thể phát 
hiểu về "tỉ lệ tử vung” hay “nguy cư tử vang” mả chỉ có thể phát hiểu răng “odds 
tử vang” trong nhóm Á cao hơn nhóm B khoảng 3,4%. Ởi đây, vì tỉ lệ tử vong 
thấp, cho nên như công thức [4| cho thấy hai chỉ số nảy giỗng nhau, và trong 
thực tế chúng ta có thể diễn dịch một OR như là một RR. 


Cách phản biệt trên có vẻ máy móc vả lí thuyết, nhưng quan trọng. Để thấy 
rũ nguy hiểm trong cách diễn dịch OR, tôi sẽ trình bảy một ví dụ sau đây. 


Ví dụ 2: Sắc tộc và tỉ lệ thông tìm (cardiac catherization). Tập san New England 
Jaurnal 0ƒ Miedicine số ra ngày 25/2/1999 (tập 349; trang 618 - 626) cũng bổ một 
nghiên cửu rất thú vị về ảnh hưởng của sắc tộc đến tỉ lệ thông tim. Trong nghiên 
cửu nảy, các nhà nghiên cửu mướn một số diễn viên điện ảnh người da trắng vả 
da đen đóng vai bệnh nhân. Các diễn viên được chỉ cách trình bảy các triệu chứng 
và bệnh trạng cẩn thận, đấy đủ, nhưng miống nhau. Họ thu hình các diễn viên vàn 
video; chọn ngẫu nhiên 720 bác sĩ chuyên lchoa tìm người da trắng, cho họ xem các 
video nảy, vả hỏi "ai cẩn được thông tin" Kết quả chủ thấy 90.6% bác sĩ để nghị các 
hệnh nhân da trắng nên được thông tim, nhưng tỉ lệ này cho bệnh nhân da đen chỉ 
84,7%. Miột nhần của kết quả có thể tắm lược trong Bảng 3 sau đây. 


Bảng 3. Sắc tộc và tỉ lệ thông tim 


Sñ bác sĩ để nghị Sñ bác sĩ không để nghĩ 
E———— tim ——"— tim 


w - Bệnh nhãn | w - Bệnh nhân datrắng | 62 
The —— 


Các nhà nghiên cứu kết luận rằng tỉ lệ bệnh nhân da đen được thông tim 
thấp hơn tỉ lệ ở bệnh nhân da trắng đến 40%. Sau khi nghiên cửu này công bố, 
giới truyền thông rấầm rộ bản về kết quả và ý nghĩa của nghiên cứu. Không cẩn 
nói ra, cũng có thể đoán được trong dư ảm và tình trạng kỉ thị chủng tộc ở Mĩ 
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củn kéo đải, những nhóm đu tranh chống kì thị chủng tộc lấy kết quả này để 
làm bằng chứng tế cáo rằng các bác sĩ da trắng kì thị bệnh nhân đa đen. Ý nghĩa 
củn sâu xa hơn: sự kì thị này có thể dẫn đến tử vong. Nói cách khác, có người 
diễn dịch răng đây là một sự giết người cỏ ý đổi 


Nhưng rất tiếc là con số 40% đỏ đã được diễn dịch cực kì sai Không những 
diễn dịch sai mà cách tỉnh toán cũng sai. Để hiểu tại sao cách diễn dịch đó sai, 
chúng ta hãy bát đẩu bằng cách tỉnh C?R của các tác giả. C?dds thông tìm trong 
nhóm bệnh nhân da trắng là: ødds_ =652/6R—=9.59. Tính tương tự, edd thông 
tim trong nhóm bệnh nhân da đen là: ødds =610/110=5.545. Do đó, OR giữa 
nhóm đa đen và da trắng là: 

nddx 5 545 


OR=——+=———=0.578 
odds 9.59 


(Chủ ý, các nhà nghiên cửu tỉnh số chắn, nên ÖR là khoảng 0,60). 


Nhưng nếu thay vì tính bằng oödds, chúng ta có thể tính bảng tỉ lệ để 
nghị thông tim cho hai nhóm. Tỉ lệ này cho nhóm bệnh nhân da trắng là: 
p„ =652/T20 = 0.906, và nhóm bệnh nhân đa đen: p, =610/720=0.84T. Và 
RR có thể tỉnh từ hai tỉ lệ này: 

RR= Th~———=0.935 
P„ (906. 

Đến đây, chúng ta thấy rõ rằng tỉ lệ để nghị thông tim trong nhỏm bệnh nhân 
da đen thấn hơn tỉ lệ trong nhóm bệnh nhẫn da trắng là 6.5% (lấy 1 trừ cho 0.935 
và nhản kết quả cho 100), chứ không phải 40% như các tác giả và giới truyền 
thông tuyên hỗ. 


Tại sao có sự khác biệt? Tại vì các tắc giả và giới truyền thông nhấm lẫn rằng 
ÔHR là RR. Trong trưởng hợp nảy, R không phải là một chỉ số thích hợp để nhân 
tích số liệu, bởi vì con số tỉ lệ quả can (B4.7% và 90.6%), và vì tỉ lệ quả cao, cho 
nên ÖR ước tính RR quả cao hơn thực tế. 


Thật ra, ở đây cách gọi "RR” cũng không chỉnh xác. RR chỉ sử dụng cho tỉ 
lệ phát sinh (incidence), nhưng trang trưởng hợp nảy không cỏ tỉ lệ phát sinh, 
mả là tỉ lệ lưu hành (prevalence). Do đó, thuật ngữ chính xác để mỗ tả 0.835 là 
prevalence ratio (PR). (Hãy là một để tải khác má tôi hì vọng sẽ có địp quay lại 
để bản thêm). Điểu ngạc nhiên là sai sót này lại hiện điện ngay trên một tập san 
y học số 1 trên thế mới 
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3. Vấn để điễn địch OR 


RR là tỉ số của hai tỉ lệ hay hai nguy cơ, vả tỉ lệ thì chúng ta có thể hiểu 
được khả dễ dàng. Nếu nỏi tỉ lệ mắc bệnh 3%, chúng ta nghĩ ngay đến 3 trong 
1ũŨ người mắc bệnh. Vì thể, vấn để diễn dịch RR khá dễ dàng. Nếu RR = 3, 
chúng ta cỏ thể nói rằng tỉ lệ tăng gấn 2 lần. Ai cũng hiểu được mà không chất 
vấn gì thêm. 

ÖR là tỉ số của hai odds. Cdds nhản ảnh “khả năng” mắc bệnh. Chdds = 2 có 
nghĩa là khả năng mắc hệnh cao hơn khả năng không mắc bệnh 2 lần. Khó hiểu. 
Odds đã khó hiểu thì tỉ số của hai odds (hay hai khả nắng) lại cảng là một đo 
lưững khó hiểu hơn vì nó quá chung chung, khó cảm nhận được. Thật ra, một 
người bình thưởng (kể cả giới bác sĩ) khó có thể hiểu chỉnh xác nghĩa của CHR. 
Chúng ta biết OR = 2 không hẳn có cùng nghĩa với RR = 2. Chính vì thế mả gắn 
đây có "phong trào xét lại” R trên các tập san y học quốc tế. Nhiễu nhả nghiên 
cứu, dịch tế học và thống kê học kiêu gọi tẩy chay ORI 

Nhưng bất cứ da lưỡng não cũng có lợi thể và khiếm khuyết. RR, dù dễ diễn 
dịch cũng cỏ khiếm khuyết của nó. Lấy vỉ dụ đơn giản: nếu tỉ lệ mắc bệnh ung 
thư trang nhóm À là 1% và nhóm B là 35, chúng ta dễ đàng thấy RR = 3. Nhưng 
thay vì nói mắc bệnh, chúng ta lật ngược lại vấn để “không mặc bệnh”: chúng ta 
có tỉ lệ cho nhóm À là 99% so với nhóm B là 979, và như thế RR = 0.87 / 0.90 = 
ũ.98, tức là tỉ lệ không mắc bệnh trong nhóm B thấp hơn nhóm À khoảng 29. 
(Nhưng nếu dùng “mắc bệnh”, nhỏm Á mắc hệnh nhiều hơn nhóm B đến 3 lần!) 
Nói cách khác, RR có thể thiếu tính nhất quản (cansistency). 


Nhưng ÖR thi không cỏ vấn để thiểu nhất quản. Trong vỉ dụ trên, nếu lấy chỉ 
số là "mắc bệnh” làm so sánh, R là 3.06. Nhưng nếu lấy “không mặc bệnh” làm 
chỉ số so sánh, thì OR vẫn là 3.06 (bạn đọc có thể kiểm tra con số này). Trong 
toán thống kẻ, người ta gọi đặc tỉnh của ÖR là symmetric (đối xửng), còn đặc 
tính của RR là asymrnetric (hất đối xứng). 


4. OH, RR và thể loại nghiên cửu 


Một khác biệt cơ bản nữa giữa RR và ÖR là sự tùy thuộc vào thể loại nghiễn 
cứu. Nói một cách ngắn gọn, RR chỉ có thể ước tỉnh từ nghiên cứu xuỗi thời 
gian (cohort praspective study), nhưng ÖR thi có thể ước tính từ tất cả thể loại 
nghiên cứu, nhưng chủ yếu là nghiên cửu bệnh - chứng. 
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Giả dụ chúng ta muốn tìm hiểu mỗi liên hệ giữa phơi nhiễm chất độc màu 
da cam (Apent Chrange — ÀÖ]) và bệnh ung thư. Một cách nghiên cửu qui mỗ là 
tuyển chọn [ngẫu nhiên] một nhóm đối tượng, sau đỏ phản nhóm dựa vào tiển 
sử có hị phơi nhiễm độc chất hay không. 5au đỏ, theo dõi cả hai nhóm đổi tượng 
một thời gian (chẳng hạn như 5 năm) và ghi nhận số người bị ung thư. Nghiền 
cửu nảy có khi gọi là mỗ hình nghiên cứu đoàn hệ. Kết quả của nghiên cửu 
như thế có thể tóm lược trong Bảng 4 sau đảy. Trong số 1000 người được thẩm 
định hị phơi nhiễm lúc ban đầu, có 30 người (hay 2) bị ung thư trong thời gian 
theo dõi; trong số 10000 người không bị phơi nhiễm AO, có 100 người (tức 1%) 
hị ung thư sau đỏ. Như vậy, RR = 0.02/0.01 = 2. Nhưng nếu tỉnh bằng odds thi 
R = 2.02. Hai chỉ số này không khác nhau đáng kể. 


Bảng 4. Một nghiên cứu xuôi thời gian (giả thuyết) 
Tam | UgAw | Khwsngw] Mạa 
mauớnO | 3 | %  [m 


Nhưng theo dõi đối tượng một thởi gian dài thường rất tốn kém. Miột mỗ 
hình nghiên cứu khác cũng có thể đáp ứng mục đích tìm hiểu mối liên hệ miữa 
.AÖ và ung thư, nhưng cần it đổi tượng hơn và không cần theo dõi một thời gian 
dải: đó là nghiên cứu bệnh - chứng. Bảng 5 dưới đây trình bảy kết quả một 
nghiên cứu (giả thuyết] như thể. Trong nghiên cửu này, chúng ta chọn 100 bệnh 
nhản ung thư và 100 đối tượng không bị ung thư, nhưng hai nhỏm này tương 
đương nhau về các yếu tổ nguy cơ. Sau đỏ, chủng ta tìm hiểu qua hỗ sơ hệnh li 
(hay phỏng vẫn) trong mỗi nhóm có bao nhiêu người hị phơi nhiễm độc chất. 
Nói cách khác, đây là một nghiên cứu “ngược thứi gian” (so với nghiên cứu “xuỗi 
thởi man” như trình bảy trong Bảng 4. Kết quả nghiên cứu bệnh chứng này được 
trinh bảy như sau. 


—.. 5. Một Huög'G5 cứu hệnh - Sinilinuissr.) (giả tưởng) - tưởng) 


Không E== nhiễm AØ 
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Trong nhỏm bệnh nhẫn, có lũ người (hay 1094} từng bị phơi nhiễm ÁD; và 
truong nhóm không ung thư, số đối tượng từng bị phơi nhiễm là 5 người (hay 5%). 
Ở đây, chúng ta không thể tính tỉ lệ phát sinh bệnh (incidence), bởi vì số lượng 
hệnh nhãn và đối chứng đã được xác định trước. Vì không thể ước tỉnh tỉ lệ phát 
sinh, nghiên cứu bệnh chứng không cho phép chúng ta ước tính RR. Tuy nhiên, 
chúng ta có thể tính ÖR, và OR trong trường hợp nảy là một tước tính chỉ số RE. 


Số liệu Bảng 5 cho thấy ndds bị phơi nhiễm trong nhóm bệnh nhân là: 10/90 
=Ũ.1111, và nhóm đối chứng: 005263. Da đó, OR = 0.1111 /0.05263 = 2.11. Thật 
Iũx95 

.=+2]1. 
S0x 5 

Điểm chính để phản biệt hai hình thức nghiên cửu này là phương pháp chọn 
mẫu. Với nghiên ciu xuối thời gian, chẳng ta xác đình số lượng đt tượng then yếu 
tổ nguy cử ngay tử ấu, và số lượng bệnh phát sinh là một số ghi nhận. Ngược lại, 
với nghiên cửu ngược thời gian, chủng ta xúc đỉnh số lượng bệnh nhân và đối tượng 
ngay tử đầu, và số lượng phưi nhiễm yếu tổ nguy cơ là số ghi nhận. 


Tuy kết quả nghiên cứu của hai thể loại nghiên cứu được trình bảy rất miống 
nhau: hai cột và hai dòng (3x2 tahle), nhưng “câu chuyện” đẳng sau của các số 
liệu này rất khác nhau. Không am hiểu cảu chuyện đăng sau của một hảng số liệu 
rất dễ dàng sai lầm trong khi phân tích! 


Vĩ dụ trên cho thấy một nguyễn lỉ quan trạng: OR có chức năng chính là ước 
tính RR. Trong điểu kiện cho phép (như nghiên cứu đoàn hệ) chúng ta không 
cần đến ÖR. Nhưng nếu không thể làm nghiên cứu đoàn hệ chúng ta vẫn có thể 
thực hiện nghiên cửu bệnh chứng vả ưức tính OR trong nghiên cứu nảy chỉnh là 
một tiếc số (estimate} của RR. Xin nhắc lại: OR là một ước số của RR. 


ra, có thể tỉnh đơn giản hơn bảng công thức “giao chéo”: £J = 


5. Tóm tắt 
Để kết thúc chương nảy, tỗi xin nhắn mạnh một số điểm chỉnh: 
«Cả hai RR và OR đều là những chỉ số phản ảnh độ tương quan giữa một 


yếu tổ nguy cơ và bệnh; nhưng RR mới là chỉ số chúng ta cẩn hiết (còn OEt 
chỉ là ước số của RR). 


«_ Vị OR tuy thuộc vào tỉ lệ hiện hành (và khi tỉ lệ hiện hãnh của bệnh cao - 
như trên 10% - thi ÔR thưởng cao hơn so với thực tế), cho nên các nghiên 
cửu này nên sử dụng prevalence raln. 
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s Các nghiên cứu bệnh chứng (case-control study) chỉ có thể cung cấp ÖR, 
chứ không phải RR. Các nghiên cứu cắt ngang có thể cung cấn OR, chứ 


không phải RR. 


«Các nghiên cứu xuỗi thởi gian (prospective stndy) cung cấp cả OR và RR, 


nhưng RR là chỉ số có ý nghĩa và dễ diễn dịch. 
s_ Tuy nhiên, RR không nhất quản như ÖR. 
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07 


ĐÁNH GIÁ HIỆU QUÁ 
ĐI VI CÁC BIÊN LIÊN TỤC 


các biến nhị nhãn, như có/không, sống/chết, bệnh/không bệnh, v.v... 

Các chỉ số đó ban nắm RR, OR, ARR, và NNT. Nhưng nhiễu nghiên cứu 
quan sát và RCT không dựa vào biến nhị phản, mà dựa vào hiến liên tục để đánh 
giả hiệu quả can thiệp. “Biến liên tục” ở đây bao gốm những đo lưỡng như cần 
nặng, nổng độ glucose, insulin, mật độ xương, huyết áp, v.v... Chẳng hạn như 
trong nghiễn cứu về loäng xương, các nhà nghiên cứu có thể so sánh mật độ 
xương giữa nhóm điểu trị và nhóm chứng để biết hiệu quả của can thiệp. 

Chỉ số để do hiệu quả lãm sàng dựa trên một hiến liên tục chỉ đơn giản là hiệu sẽ 
của hai số trung bình, khoảng tin cậy 95% (KTC) của hiệu số, và trị số P. Hiệu số và 
KTCS5 cung cấp cho chúng ta mức độ khác biệt miữa hai nhém có ý nghĩa lâm sảng 
hay không. Trị số P cung cấn một chỉ số về ảnh hưởng của các yếu tổ ngẫu nhiên. 
Dựa vào các chỉ số này nhà nghiên cứu có thể phát biểu về hiệu quả lắm sàng trong 
các nghiên cứu RCT hay khác biệt miữa hai nhằm trang các nghiên cứu quan sát. 

Ví dụ 1: Loäng xương ở bệnh nhãn đa xơ cứng (multinple sclerosis, MS). Các 
nhà nghiên cứu thực hiện một nghiên cửu bệnh chứng, bao gốm 54 bệnh nhẫn 
MS và 54 người trong nhóm chứng, cả hai nhóm có cùng độ tuổi, cân nặng. Họ 
đo mặt độ xương ở xương cột sống và xương đủi, và phản tích một số marker 


T rung hai chương trước, chúng ta đã điểm qua các chỉ số về hiệu quả cho 
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chu chuyển xương [I|. Bảng 1 dưới đây trình bảy một số số liệu liên quan để 
minh họa cho vấn để chúng ta quan tâm. 


Bảng 1. So sánh các chỉ số về xương giữa bệnh nhân đa xơ cứng (MS) 


và nhằm chứng 
MS(n=54) Nhóm chứng (n = 54) 
Mật độ xương cột sống (pm?) 0.78(008) - (I.88 (0.07) | 
Mật độ xương đủi (gfcm?) .56 (0.04) 0.72 (0.07) 
steocalcin (pg/nL} 15. (3.76) 6.3 (2.01) 
Vitamin D (ngímL) 18.3 (4.05) 38,6 (7.50) 
PTH (pg/dL) 72311.) 38,6 (1L) 


Chủ thích: Số trang ngoặc là độ lệch chuẩn; số ngoài ngoặc là số trung bình. 


1. Effect size 

Câu hỏi đặt ra là dùng chỉ số nảo để so sánh hai nhóm? Để kiểm định hai 
nhóm có khác nhau, có thể dùng kiểm định t (hay t-test). Do đỏ, chỉ số đơn giản 
nhất là tỉnh hiệu số (tạm kí hiệu là ID} giữa hai nhóm: 


MS [n = 54) . 
(n = 54) 
Mật độ xương cột sống (gícm?)  0.78(0.08) (1.88 (0.07) -.10 
Mật độ xương đủi (g/cm”) 0.56 (0.04) 0.72 (0.07) -.16 
Osteocalcin (pg/nL) 15.2 (3.76) 6.3 (2.01) 8.90 
Vitamin D (ngimL) 18.3 (4.05) 39.6 (7.50] -21.3 
PTH (pg/dL) 72.3 (112) 39,6 (11.8} 327 


Tuy nhiên, vẫn để của D là các biển số sinh hóa này có đơn vị khác nhau. Mật 
độ xương thi tỉnh hằng gicm°, osteocalcin cả đơn vị là ngỉnL, v.v... Do đỏ, rất 
khó so sánh D giữa các biến. Một cách để “chuẩn hỏa, hay hỏa giải vấn để đơn vị 
đo lường, là chia D cho độ lậch chuẩn 5D, và gọi đó là effect size (ES): 

E.S _ PIEAH, — meah, 


Nhưng độ lệch chuẩn nào? Một số nhà nghiên cứu để nghị dùng độ lệch 
chuẩn của nhóm chứng. Nhưng cũng có ý kiến dùng độ lệch chuẩn bình quản 
của hai nhóm. Cách tính độ lệch chuẩn bình quản hơi luộm thuộm, nhưng với 
máy tính thì không còn là vấn để. Chẳng hạn như độ lệch chuẩn hình quân cho 


- 11 - 


htfps://tieulun.hopto.org 


mật độ xương cột sống có thể tính như sau: 

s« Tỉnh tổng binh phương, tức phương sai nhàn cho số cũ mẫu trử Ì: 
55 nhóm Ì = (0.08) x (54— 1} =0.3393 
55 nhóm 2 = (0.07}” x (54 — 1} =0.2587 
3 = 0.3393 + 0.2597 = 0.5990 

«_ Tỉnh nhương sai bình quản cho hai nhỏm, tức 55 chia cho tổng số cổ mẫu 
trữ 2: 
5° =I.588 / (54 + 54 — 2) = 0.0056 

«Tỉnh độ lệch chuẩn hình quản cho hai nhóm, tức căn số bậc 2 của phương 
Sai: 


$D=+|S° =xÍ0.0056 =0.075 
Tính tương tự cho từng hiến trong bảng, chúng ta có bảng dưới đây: hiệu số 
D, độ lệch chuẩn 5D, và E5. 


D "hh E5 =D/SD 
Mật độ xương cột sống (pfcm”] -ũ.1ũ ũ.075 -1.33 
Mật độ xương đúi (g/cm?] -.16 ũ.057 -2.ã1 
Csleocalcin (pgínL) 8.0) 3.015 2.15 
Vitamin ÙD (ngmL) -21.3 6027 -13.3 
PTH(fpgidL) k Kế 11.555 2."3 


Chúng ta có thể diễn giải như sau: mật độ xương cột sống của nhóm bệnh 
thấp hơn nhỏm chứng 1.335 độ lệch chuẩn. Chú ý rằng ES không cỏ đơn vị, nền 
chúng ta có thể so sánh mức độ ảnh hưởng giữa các biển. Chẳng hạn như bảng 
so sánh trên cho thấy bệnh MS có ảnh hưởng đến mật độ xương đùi hơn là 
xương cột sống. Nhưng MS có ảnh hưởng lớn đến vitamin D, vì vitamin Ï} của 
nhóm bệnh thấp hơn nhóm chứng đến 3.5 độ lậch chuẩn. 

2. Ý nghĩa của ES 

Chỉ số E5 có vẻ giải quyết vấn để đơn vị đo lưỡng và chuẩn hóa. Nhưng vẫn 
để đặt ra là ý nghĩa thật của nó. Mức độ ảnh hưởng hay mức độ liên quan có thể 
đánh giá dựa vào xác suất phản định giữa hai nhóm của một biến. Chúng ta thử 
tưởng tượng nếu có một hiển tiên lượng (tạm gọi là X}) có thể phản chia nhỏm 
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bệnh và nhóm chứng một cách rành mạch, thì nhãn bố của X trong nhóm hệnh 
hoàn toàn không trùng hợp với nhóm chứng như Biểu đỗ 1 dưới đây. 


Bieu dễ 1. Biểu đồ phân bố chuẩn của biến X trong nhóm bệnh [trung bình 0.45, 
độ lạch chuẩn [SD] 0.10] và nhằm chứng [trung bình 1.10, SD 0.10]. Biểu đổ này mình họa 
cho trường hợp E5 = 6.5. Chú ý không có trùng hợp (overlap] giữa hai dường phân bế. 


Nhưng nếu E5 = Ú.5 (tức D = 0.75 — ñ.7Ũ, và SD = 0.10), thi mức độ overlap 
giữa hai nhãn bố khá can như Biểu để 2 dưới đây. 


Biếu đồ 2. Biểu dễ phân bố chuẩn của biến X trong nhóm bệnh [trung bình 0.70, SD 0.10] 
và nhm chứng [trung bình 0.75, SD 0.10]. Biểu cổ này minh họa cho trường hợp ES =0.5. 
Diện tích œwverlap thể hiện bằng vùng màu xám có thể tỉnh bằng tích phân, 
và trong trường hợp này là 0.802 [tức 80.2%]. 
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Khi ES = 1, tức mức ảnh hưởng khá cao, thì mức độ overlan giữa hai nhỏm 
vẫn có thể lên đến khoảng 62% như thể hiện qua Biểu đã 3 dưới đây. 


Ƒ 
" 


Biểu đổ 3. Biểu d phãn bố chuẩn của biến X trong nhóm bệnh [trung bình 0.70, 5D 0.10] 
và nhỏm chứng [trung bình 0.80, SD 010]. Biểu đồ này minh họa cho trường hợp ES = 1. 
Diên tích averlap thể hiện bằng vùng màu xảm có thể tỉnh bằng tích phản, 
vả trong trường hợp này là ũ.617. 


Ngay cả khi ES = 2, tức mức độ khác biệt giữa 2 nhóm cao gấp 2 lấn độ lệch 
chuẩn, nhưng xác suất œverlap giữa hai nhỏm vẫn có thể lên đến 32 như Biểu 
đã 4 dưới đây cho thấy. 


Biểu đổ 4. Biểu đề phãn bố chuẩn của biến X trong nhóm bệnh [trung bình 0.70, 5D 0.10] 
và nhỏm chứng [trung bình 0.80, 5D 0.10). Biểu đổ này mình họa cho trường hợp E5 = 2. 
Diện tích œverlap thể hiện bằng vùng màu xám có thể tỉnh bằng tích phản, 
vả trong trường hợp này là ũ.317. 
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Các biểu đỗ trên cho thấy khi E5 cảng thấp xác suất overlap cảng cao, vả 
ngược lại, khi E5 cảng cao xác suất overlap cảng thấp. Điểu thủ vị là ngay cả mức 
độ ảnh hưởng khá cao như ES = 3, chúng ta thấy tỉ lệ trùng hợp vẫn lên đến 321. 


Nói tóm lại, E5 là một “thước đo” dùng để đánh giá hiệu quả của can thiện 
dựa trên một biến liên tục. E5 là mức độ khác biệt với đơn vị là độ lạch chuẩn. 
Tuy nhiên, E5 cũng có thể hiểu qua xác suất trùng hựp giữa phản bố của hai 
nhóm, và đỏ là một chỉ số quan trọng để chúng ta có thể đánh giá ảnh hưởng 
thực của một hiển số mà trị số P không thể phản ảnh. 


TÀI LIỆU THAM KHẢO 


l. Atteritano M,etal Bone Mineral Density, Bone Turnover Markers and Fractures 
in Patents with Svstermic Sclerosis: Á Case Control Study. PLaS ONE 2013;8(6): 
cũ6001., 
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08 
DIỄN GIẢI KẾT UẢ CHẨN ĐUÁN 


chứng và kết quả xét nghiệm” Từ điển y khoa của phương Tây thi định 

nghĩa tương đối chỉ tiết hơn: chẩn đoán là qui trình xác định bản chất 
của một bệnh bằng cách xem xét các dẫu hiệu và triệu chứng của bệnh nhản, 
và khi cẩn thiết, xem xét kết quả các xét nghiệm và khảo sát X-quang. Nói cách 
khác, chẩn đoán - cũng như nghiên cứu khoa học - là một qui trình đi tìm điểu- 
chưa-hiết (the unknown) băng cách dựa vào những điểu có thể quan sát được. 
Biểu có thể quan sắt được là qua đo lưởng bằng các thiết bị y học hay khám 
nghiệm lãm sảng. 


Thế nhưng các thiết bị máy móc và xét nghiệm lãm sàng vẫn có một vải sai 
sót, không ít thì nhiều. Những sai sốt này có thể làm cho kết quả chẩn đoán thiếu 
chỉnh xác vả thiểu tin cậy. Những trưởng hợp sai sót trong chẩn đoán thì rất 
nhiễu, nhưng cũng cỏ vải trưởng hợp gãy ra thảm họa cho bệnh nhân [|]. 


Khi đạc y văn liên quan đến chẩn đoán, chúng ta thưởng bắt gặp những thuật 
ngữ như sersilivity, sheciltcity, false pasitlive rafe, positive pnrerlicHve value, likelhand 
raïin, v.v... Những thuật ngữ này cỏ nghĩa gi? Cách diễn giải ra sao? Trong chương 
này tôi sẽ lần lượt giải thích những thuật ngữ trên bằng những ví dụ cụ thể. 


T tỉ điển tiếng Việt định nghĩa chẩn duän là “xác định bệnh, dựa theo triệu 


1. Phân biệt: bệnh trạng và kết quả xét nghiệm 


Nói một cách đơn giản, một cá nhân hoặc là có bệnh, hoặc là không có bệnh. 
Tuy đơn giản như thế, nhưng làm sao để biết có bệnh hay không có bệnh không 
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phải là một điểu dễ dàng chút nào. Trạng thái bệnh và không bệnh là một hiện 
tượng chúng ta khó quan sát được, hay có trưởng hợp cá biệt, chúng ta thậm 
chí không thể quan sát được. Chẳng hạn như để biết chắc chẳn có ung thư hay 
không, phương pháp chuẩn là dùng sinh thiết. Sinh thiết là một phẫu thuật nhỏ, 
với mục tiêu tối hậu là để xác định xem có ng thư hay không có ung thư. 

Vì khá (hay không) quan sát trực tiến được, nên chúng ta phải dùng các 
phương pháp gián tiếp như X-quang vả xét nghiệm bằng các phương pháp sinh 
hóa. Kết quả của xét nghiệm cho chúng ta hai giả trị: dương tính (+ve) hay âm 
tính (-ve]. 

Như đã để cập trên, không có một phương pháp xét nghiệm gián tiếp nào, 
dủ tính vị đến đâu đi nữa, là hoàn hảo và chính xác tuyệt đối. Một số người có 
kết quả dương tỉnh, nhưng thực sự không có ung thư. Và một số người có kết 
quả ảm tính, nhưng trong thực tế lại có ung thư. Đến đây thì chúng ta có bốn 
khả năng: 

s bệnh nhãn có bệnh, nhưng kết quả thử nghiệm là dương tỉnh. Đây là 
trường hợp dưng tính thậi (thuật ngữ chuyên mỗn tiếng Anh gọi là truc 
ptpsifive hay sensifivity); 

s bệnh nhản không có bệnh, nhưng kết quả thử nghiệm là dương tỉnh. Đây 
là trường hợp dương tính giả (faÍse pasilive}; 

s bệnh nhãn không có bệnh, nhưng kết quả thử nghiệm là äm tỉnh. Bảy là 
trưởng hựp của äm tính thật (truc negụative hay shecilicity}; và 

s® bệnh nhän cỏ bệnh, nhưng kết quả thử nghiệm là äm tỉnh. Đãy là trường 
hựp âm tỉnh giả (false neguaHve)}. 


Bốn khả năng nảy có thể tóm gọn trong bảng sau đây. 


- Tình trạng “thật” của bệnh 
Kết quả xét nghiệm 
Khôngí bện 


Lương tính (+ve} Dương tính thật [hiơng tỉnh giả 
Sensitivity, true positive False nasilive 

Ẩm tỉnh (-ve} Âm tính giả Âm tính thật 
False negative Specificity, true nepative 
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2. Chỉ số đánh giá phương pháp xét nghiêm: Sensitivity và Specillcity 


Để đánh giá độ chính xác của một phương pháp xét nghiệm, các nhà nghiên 
cửu thưởng ước tính tỉ lệ dương tính thật (tức là sensitivity probability) vả tỉ lệ 
äm tỉnh thật (specilicity probability). Cách tỉnh của hai tỉ lệ này có thể mình hợa 
hãng một nghiên cứu sau đây. 

Ví dụ 1 (chẩn doán bệnh tiểu đương). Phương pháp chuẩn để chẩn đoán 
hệnh tiểu đường là phân tích máu. Nếu kết quả phản tích mắu là +ve thì bệnh 
nhắn được xem là mắc bệnh đái đường vả sẽ được điểu trị; nếu kết quả là —ve thi 
người đỏ xem như không mắc đái đường. Nhưng phương pháp phản tích mắu 
mang tỉnh tương đổi xäm phạm (phải lấy mẫu máu) và tốn kém, cho nên các nhà 
nghiên cửu phát triển một phương pháp khác đơn giản hơn, it xâm phạm hữn, 
và ít tấn kém hơn: thử bảng nước tiểu. Xét nghiệm bằng nước tiểu cũng cho hai 
kết quả: +ve và —we. Vấn để đặt ra là xét nghiệm nước tiểu chính xác cỡ nào và có 
thể ứng dụng chu một quần thể lứn hay không? 

Để trả lời câu hỏi này, các nhà nghiên cửu tiến hành một nghiên cứu theo 
kiểu đổi chứng. Họ chọn ngẫu nhiên 1000 đổi tượng nữ. Họ tiến hành xét 
nghiệm bảng phương pháp chuẩn (phản tích máu) và phương pháp củn trang 
vòng thí nghiệm (phần tích nước tiểu). Kết quả được tắm lược trong bảng thống 
kê sau đây. 


Bảng 1. Chẩn đoán bệnh đái đường: 
kết quả xét nghiệm bãng phương pháp chuẩn và thí nghiệm 


Kết quả phản tích Kết quả phân tích máu 
me... [| cm. | 
Tp | j” J mm | 


Nói cách khác, trang số 17 người mắc bệnh đải đường (dựa vào xét nghiệm 
máắu)., có lũ phụ nữ có kết quả xét nghiệm nước tiểu +ve, và l6 người có kết 
quả —ve. Trong số 83Ú người không mắc bệnh đái thảo đường, 3Ú người có kết 
quả phân tích nước tiểu +ve, và 8ÙŨ người có kết quả —ve. 


Với những số liệu nảy, chúng ta có thể ước tính tỉ lệ dương tính thật (viết tắt 
là Sens} như sau: 
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Sens =-ÌỦ ~ 0.050 
I7ũ 


và tỉ lệ ãm tỉnh thật (viết tắt là Spec}: 
hú 
=——=ll4 
kiu ñ30 

Như vậy, tỉ lệ dương tính giả (EP) là: 

FP = Ìl - 5pec = I.036 
và tỉ lệ ãm tỉnh giả (FN]: 
FN = l- 5ens = Ũ.84I 

Qua kết quả phản tích này chúng ta thấy dù phương pháp xét nghiệm nước 
tiểu khả chỉnh xác trang việc tuyên bổ một đổi tượng là kháng mắc bệnh đái 
đường, vì tỉ lệ äm tỉnh thật lên đến 96.4%, nhưng rất kém trong việc chẩn đoán 
bệnh nhân mắc bệnh này, vì tỉ lệ dương tính thật quá thấp, chỉ khoảng 6ú. Kết 
quả phản tích trên cho phép chúng ta phát biểu răng phương pháp xét nghiệm 
hảng nước tiểu chỉ nhát hiện khoảng 6⁄ú trong số những người thật sự hị bệnh 
đái tháo đường. Nói cách khác, 94% bệnh nhân đải tháo đường, nếu xét nghiệm 
hằng phương pháp nước tiểu cỏ kết quả äm tính. 

Xin nhấn mạnh một lẩn nữa rằng hai tỉ lệ dương tỉnh thật và ãm tỉnh thật 
(hay các tỉ lệ như dương tỉnh giả và äm tỉnh giả) mà tôi vừa để cập trên là những 
chỉ số phản ảnh độ chỉnh xác của phương pháp xét nghiệm mả thôi. Nói then 
ngön ngữ xác suất (chủ ý đấu ”[” có nghĩa là “với điểu kiện”): 

Sens = PF (+ve | mắc bệnh) 

Tương tự, tỉ lệ äm tính thật là xác suất mà một cả nhân có kết quả -ve với điểu 
kiện cá nhân đó quả thật không mắc hệnh: 

Spec = P (-ve | không mắc bệnh) 

Thể nhưng, rất tiếc là trang thực tế có rất nhiều bác sĩ không hiểu ý nghĩa của 
hai tỉ lệ này nên đã diễn dịch (sai) rằng tỉ lệ dương tỉnh thật là xác suất mà bệnh 


nhắn sẽ mắc bệnh! 


3. Chỉ số liên quan đến bệnh nhân: Trị số tiên đoán dương tính 


Xin nói cụ thể hơn: hai chỉ số sensitivity và speciliicity không cung cấp cho 
chúng ta thông tin mả chúng ta cẩn biết: xác suất mà một cá nhắn mắc bệnh hay 
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không mắc bệnh là bao nhiêu nếu cá nhân đỏ có kết quả +ve hay —ve. Nói theo 
ngũn ngữ xác suất, chủng ta (và bệnh nhắn) muốn biết: 


P (mắc bệnh | +ve) 


P (không mắc bệnh | -ve] 


Trong dịch tễ học, P(mắc bệnh | +ve} được đặt tên là pasitive predictive value 
(PPV) mà tôi tạm dịch là frị số Hên đoán dương tính. Tương tự, P(không mắc 
bệnh | -ve} có tên là negafive predicHiue walue (PPV - trị số tiên đaân âm tính). 


PPV và NPV tùy thuộc vào ba yếu tổ: sensitivity, speciliicity, và prevalence 
(tỉ lệ hiện hành của bệnh). Thông thưởng, chúng ta muốn biết PPV hơn là NPV, 
cho nên tôi sẽ giải thích chi tiết về chỉ số này. Công thức cụ thể để ước tỉnh PPV 
là như sau: 
xenwiiivity x prevwalence 


PPF=———————————-.- 
XeNsiiwifw + prewalence + (I — specilicity]}x (I — prewalence] 


Trong công thức trên, một thông tin quan trạng để ước tỉnh PPV là prevalence 
hay tỉ lệ hiện hành của bệnh. Ởï Việt Nam, theo vải đữ liệu nghiên cửu, tỉ lệ tiểu 
đường trong cộng đồng là khoảng 5%. Nói cách khác, prevalence = U.05. 


Quay lại với ví dụ 1 trên, với phương pháp xét nghiệm củ sens = 158 và snec 
=Ũ.964, chúng ta có thể tính EPV như sau: 


PPV= ũ.059x0.u5 -0079 
(0.059x0.05)+(1—0.964)x(1~0.05) 
Nỗi cách khác, nếu một cá nhắn có kết quả xét nghiệm nước tiểu là +ve, thi 


xác suất mả cá nhân đó mắc bệnh tiểu đường là 0.079 hay 7.9%. 


BPV là một chỉ số quan trọng trong chẩn đoán vi nó cung cấp chủ chúng 
ta thông tín liên quan đến khả năng mắc bệnh trong điểu kiện một kết quả xét 
nghiệm là +ve (dương tỉnh). Tuy nhiên, như để cập trên, rất nhiều bác sĩ diễn 
giải sensitivity (H lệ dương tỉnh thật) như là PPV, và diễn dịch này sai. Công thức 
tính PEEV như trình bảy trên thường thấy trang các sách miáo khoa dịch tế học, 
thoạt đấu mới nhìn qua thì có vẻ phức tạp, nhưng thực ra, có một cách thể hiện 
PPV đơn giản hơn vả logic hơn: đó là bằng biểu đỗ. Tôi sẽ mình họa qua trường 
hợp chẩn đoán ung thư vú. 
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Để hiết một phụ nữ bị ung thư vú hay không, cách chính xác nhất là qua giải 
phẫu (hay sinh thiết], hay trong trưởng hợp những người đã chết, là qua giảo 
nghiệm tử thi. Nhưng giải phẫu là một thuật mang tính xâm phạm thẫn thể can, 
và tốn kém. [2a đó, các nhà khoa học phát triển nhiều phương pháp để có thể 
chẩn đouản ung thư mà không cắn đến giải phẫu để biết bệnh trạng của bệnh 
nhản. Trang trưởng hợp ung thư vú, một phương pháp công nghệ cao là chụp 
X-quang tuyển vú, hay còn gọi là mamrmnneraphy. 


Cũng như bất cử cách xét nghiệm nảo, kết quả của việc khám nghiệm hằng 
X-quang tuyến cỏ thể là +ve hay —ve. Một kết quả dương tỉnh có nghĩa răng bệnh 
nhắn có thể bị ung thư vú, và một kết quả äm tính cho biết bệnh nhân có thể 
không hị ung thư vú. (Hai chữ “có thể” ở đây rất quan trọng, vì nó nói lên một sự 
hất định trong việc chẩn đoán ung thư vú bằng X-quang tuyến). 


Vi dụ 2 (chẩn đuản ung thư vú): Bệnh nhẫn là một phụ nữ người Mĩ, 55 tuổi, 
không có tiền sử ung thư vú. Bà đi khám mammography vá kết quả +ve. Chúng 
ta biết răng sensitivity của xét nghiệm mammopgraphy là khoảng 75 - 90%, và 
specihcity cũng khoảng 9Ú - 95%. Chúng ta sẽ lấy giá trị cao nhất là sens = Ũ.90 
và spec = (85, Câu hỏi bệnh nhân đặt ra là xác suất mả người phụ nữ đỏ hị ung 
thư là bao nhiêu? 


Phần lớn các bác sĩ, kể cả bác sĩ quang tuyển có kính nghiệm lâu năm, đều 
trả lời là 90. Nhưng cầu trả lời đó sai. Tï lệ dương tỉnh thật - sensitivity không 
phải, xin nhấn mạnh một lấn nữa, là xác suất mắc bệnh. Xác suất mắc bệnh phụ 
thuộc vào tỉ lệ dương tỉnh thật, tỉ lệ äm tỉnh thật, và xác suất mắc hệnh trung 
hình. Chúng ta thử áp dụng PPV để trả lời câu hỏi này như sau. 


Hãy tưởng tượng một quản thể gốm 100000 phụ nữ trong độ tuổi 55. Qua 
nghiên cứu dịch tế học, chúng ta biết rằng khoảng 1% trong số nảy mắc hệnh 
ung thư vú. Do đỏ, trong số này có IŨŨŨ phụ nữ hị ung thư vủ và #9000 người 
không mắc hệnh: 
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Như nỏi trên, vì tỉ lệ dương tính thật là 90%, trong số 1000 phụ nữ với ung 
thư vú nếu đi khám mammography, sẽ có 1000x0.90 = 900 người có kết quả +ve. 
Trong số 89000 người không có ung thư vủ, vì tỉ lệ ầm tính thật là 95, cha nên 
nếu 99000 người đi khám memmography, sẽ có 99000 x (1.85 = 94050 người có 
kết quả +ve, và 29000 — 94050 = 4950 có kết quả +ve (tức là dương tỉnh giả). 
Chúng ta tiếp tục thể hiện các thông tin này như sau: 


= 


FE 


Như vậy, chúng ta có tất cả là 900 + 4950 = 5850 kết quả +ve. Nhưng trong số 
này chỉ có 900 là thật sự mắc ung thư vú, do đỏ, PPV = 900 / 5850 = 0.153. Nói 
cách khác, xác suất mả phụ nữ đó mắc ung thư vú là khoảng 15% (chứ không 
phải 9094 như nhiều người lắm tưởng). 

Có thể xem xét nghiệm là một sự cập nhật hóa thông tin về chẩn đoán. Lúc 
đầu khi chúng ta chưa có thông tin về bệnh nhân, xác suất mả bệnh nhẫn mắc 
hệnh ung thư là 1% (tức là xác suất trung bình cho cả quần thể cùng tuổi, hay tỉ lệ 
hiện hành). Sau khi chúng ta có kết quả +ve từ xét nghiệm bằng mammography, 
xác suất bệnh nhãn hị ung thư tăng lên 15%. Can số 1 5ú có lễ chưa phải là một 
xác suất quá cao; song nếu được so sảnh với xác suất ban đu (11), và nó thể 
hiện một sự gia tăng về khả năng mắc bệnh đến 15 lấn. Tùy vào cảm nhận của 
từng bệnh nhãn, con số nảy cẩn phải được truyền đạt một cách chính xác để 
hệnh nhãn không phải lo lắng với cái “bản án” chẩn đoán ung thư. 


4. Tỉ số khả đĩ — likelihood ratio (LR) 


Giá trị khoa học của một phương pháp xét nghiệm có thể đánh giả qua 
sensitivity và speciiicity như để cập trên. Một tỉ số khác cũng cỏ ích trong việc 
đánh giả sự chỉnh xác của phương nháp xét nghiệm là likelihood ratio (tạm dịch 
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là tỉ số khả dĩ). Có hai loại LR: likelihood ratio positive (LR+, tỉ số dương tính 
khả dĩ) và likelihood rao negative (LR-, tỉ số äm tính khả dĩ). Tôi sẽ để cập chi 
tiết về LR+ vi nó có ý nghĩa quan trọng đến việc chẩn đoán cho bệnh nhẫn. Công 
thức của LR+ là: 
— JŒWWINMIĐ — ÍfHf + Vử 
l—specjfrty | fulse + ue 


_ l—#ensiiiwiw — false— we 
' smeciitit — true—ve 

Qua công thức trên, chúng ta thấy LR+ thực chất là tỉ số của tỉ lệ đương tính 
thật vả tỉ lệ dương tính giả. Nói cách khác, LR+ là tỉ số giữa xác suất kết quả xét 
nghiệm +ve chủ một người mắc bệnh vả xác suất kết quả xét nghiệm +ve cho 
một người không mắc hệnh. (Tương tự, LR- là tỉ số giữa xác suất kết quả xét 
nghiệm -vwe cho một người mắc bệnh vả xác suất kết quả xét nghiệm -ve cho một 
người không mắc hệnh). 

Vì thể, một LR+ cao hơn 1 có nghĩa là kết quả xét nghiệm cho thấy khả nắng 
đổi tượng mặc bệnh cao, và một LR+ < 1 có nghĩa là kết quả cha thấy bệnh nhân 
không mắc bệnh. LR+ cảng cao, khả năng mắc bệnh cảng cao. Khi LR+ > lũ 
được xem là một bằng chứng về khả năng mắc bệnh của bệnh nhắn. Ngược lại, 
khi LR+ < 0.1 được xem là bảng chứng cá nhắn không mắc bệnh. 

Trong trưởng hợp chẩn đoán ung thư vú bằng mammopgraphy, tỉ lệ dương 
tính thật là 0.95 và dương tính giả là 35%; do đó, LR+ là 0.95/0.05 = 31.7. Nói cách 
khác, nếu kết quả xét nghiệm mammography là +ve thì khả năng bệnh nhẫn mắc 
hệnh ung thư vú cao hưn dương tỉnh giả đến gắn 32 lẩn. Nhưng vấn để đặt ra là 
LR+ phải cữ nào mới có thể xem là cao? Theo các chuyên gia dịch tế học thì bảng 
chỉ dẫn sau đây là một gợi ý để diễn dịch. 


Mức độ LR+ và ảnh hưởng đến khả năng mắc bệnh 


LR > lũ Khả nắng mắc bệnh cao 
LR = 5 - 1Ũ Khả năng mắc bệnh trung bình 
LR-= 2 - 5 Khả năng mắc bệnh thần 
LRE < 2 Khả năng mắc bệnh rất thần 
LR = I Xét nghiệm vũ dụng 
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5. Ước tính xác suất mắc bệnh từ LIR+ 


Đối với thực hành lãm sảng, sự chính xác của một phương pháp xét nghiệm 
là một yêu cẩu quan trọng, nhưng mục đích của chẩn đoán không phải là tìm 
hiểu độ chỉnh xác của nhương pháp xét nghiệm, mả là tìm ước tính nguy cơ (xác 
suất) mắc bệnh cho một cá nhân. Trong phần trên, tôi đã mỏ tả cách tính đó 
hãng chỉ số PPV - trị số tiên đoán dương tỉnh. Ngoài PEV, chúng ta cũng có thể 
ứng dụng LR+ để ước tính nguy cơ xác suất mắc bệnh cho một cá nhân. 

Cách tính xác suất mắc bệnh sau khi có kết quả +ve dựa vào LR+, tuy không 
phức tạp, nhưng tương đổi công kếnh, nên có một cách ước tỉnh mang tỉnh máy 
móc: đó là dựa vào biểu đỗ có tên là namagram, có khi còn gọi là biểu đỗ Fagan 
(Fagans nomogram} như sau: 


ũ1 k& 
LÊ. 
85 
I ~ ĩ § 
# 1 N 
: 
8.5 j= 
82 
g1 
8.0% 
lũ. 
881 
9.00% d 
0.002 F 
g5 
sz 
LÓ] Thì 


Pre-lesl Likelihood Post-Ies1 
Probahility Ratin Proha bility 


F— ` 

"mm" 

sx gšš SẼ 
-„ =6 EẼU § 


Biếu đổ Fagan: cột phía trải là xác suất mắc bệnh trước khi chưa có kết quả xét nghiệm; 
cột qiữa là LR+; và cốt phia mặt là xắc suất mắc bệnh sau khi đã có kết quả xét nghiệm. 
Biểu để này dược công bố lần cầu năm 1875 bởi tác giả T. J. Fagan. 
[Nnmoaram for Bnves thearem. New Enalmndl_lnurnal nÊ Merlicine 1975: 203-257). 

Biểu đổ này có thể in ra và sử dụng cho bất cử trường hợp chẩn doän não. 
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Vi dụ cách sử dụng Biểu đã Fagan: Chúng ta quay lại Vĩ dụ 2 về xét nghiệm 
ung thư vú, cách tiớc tính xác suất mặc bệnh có thể được tiến hành hãng 3 hước 
sau đây (xem thêm biểu để vỉ dụ dưới đây): 


s Bước l: Tỉ lệ hiện hảnh ung thư vủ trong độ tuổi là 1% (tiếng Anh gọi là 
EPre-test Probability hay Prior Prohbahility); nói cách khác trước khi có 
kết quả xét nghiệm, xác suất mà bệnh nhắn bị ung thư vú là 1%. Chúng ta 
rả suát cột phía trải của biểu đỗ Eagan và làm dấu ngay tại con số Ì; 


s Bước 2: Tỉnh LR+: vì tỉ lệ dương tính thật là 909% và âm tính thật là 95u 
(tức dương tỉnh giả là 5%). Do đỏ, LR+ = 0.90/0.05 = 18 như vừa tỉnh trên. 
Chúng ta rả soát cột miữa (Likelihoad Ratio) của hiểu đỗ Fagan và làm dấu 
giữa con số 2Í và 5Ú sao cho tương đương với 32; 


«Bước 3: Lấy một thước thẳng nổi từ đấu của cột bên trải và cột chính giữa 
rồi kéo dài đến cột phía phải (xem đường thẳng có mũi tên). Chúng ta thấy 
kết quả khoảng giữa 20 và 30; do đó, sau khi có kết quả xét nghiệm, xác 
suất bệnh nhãn hị ung thư vú là khoảng 24% (tiếng Anh gọi là Post-test 
Erobability hay Posterior Probability). Chú ý răng ước tỉnh này đúng với 
xác suất PPV như phần trên. Dĩ nhiên! 


= 
tự 
tạ 
Tử 
k_ 
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sẽ 
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2g 
tê 
3 
ữ 
1 
Vĩ dụ cách ước tĩnh xác suất ung thư vũ: cột phía g5 
trải là xát suất mắc bệnh trước khi chưa có kết mg 
quả xét nghiệm [1%]; cột giữa là LR+ = 18; và cột Aỹ 
phía mặt là kết quả xác suất mắc bệnh sau khi Pre-leil Likelihood Post-Iesl 
dã có kết quả xét nghiệm (khoảng 15%]. SSSS) ... _ 
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Tôi đã giới thiệu vả giải thích các chỉ số liên quan đến chẩn đoán mả bạn đọc 
thưởng gặp trang các hải báo y học: sensitivity (tỉ lệ dương tỉnh thật), speciicicity 
(tỉ lệ äm tỉnh thật], false positive rate (tỉ lệ dương tỉnh giả), likelihood raHo (tỉ sẽ 
khả di), và nositive nredictive value (trị số tiền đoán dương tỉnh). Những chỉ số 
này (tắm lược trong phần chủ thích) có thể giúp cho giới bác sĩ chẩn đoán chính 
xác hơn vả đi đến một quyết định lãm sảng sáng suốt hơn. 


Chẩn đoán là một quả trình biến đổi dữ liệu thành tên của bệnh tật. Dũ kiện 
ở đây là kết quả thử nghiệm (và các yếu tổ khác liên quan đến hệnh nhãn). Chẩn 
đoán, đứng trên phương điện xác suất mà nói, là trả lời cu hỏi trên. 


Do đá, chẩn đoán, nói một cách thực tế nhất, là một xác suất. Trong toán 
học, xác suất thường được giải thích băng một ví vụ về trỏ chơi súc sắc hay một 
đồng xu. Một đồng tiến (kim loại) có hai mặt, và hãy tạm gọi hai mặt đó là À và 
B. Nếu chúng ta mieo đồng tiền đó một lấn, kết quả sẽ là: hoặc Ä xuất hiện, hoặc 
B xuất hiện. Nếu chúng ta gieo nhiều lần (hàng triệu lần chẳng hạn), chúng ta sẽ 
kì vọng mặt Ä sẽ xuất hiện khoảng 50 phần trăm. Theo một định nghĩa của toán 
học, xác suất mặt Ä xuất hiện là ñ.5 hay 50%. Chúng ta cũng có thể nói xác suất 
B xuất hiện là 509%. 


Nhưng đó là một ví dụ tương đổi vô bổ, khô khan, chẳng có giá trị ứng dụng 
gì trong thực tế. Chúng ta củ thể đặt ví dụ xác suất đó trong mỗi trưởng xã hội vả 
y tế một cách thực tế hơn. Ví dụ trong một cộng đồng cư dẫn gốm 10ũ0 người, 
có 20 người bị bệnh ung thư. Cï đây số người có tiểm năng bị ung thư là 1000 
người, và số người thực sự bị ung thư (sự kiện) là 3 người. Chúng ta có vải cách 
phát hiểu về qui mỗ này: 

« Cách thử nhất là dùng con số phần trăm: “Tỉ lệ hệnh ung thư trang cũng 

đẳng là 2 phần trăm” (lấy 20 chia cho 1008, rỗi lấy kết quả nhân cho 100). 


s Cách thử hai là đơn giản lấy 20 chia cho 1000 và với kết quả 0.02, chúng 
ta cũng có thể phát biểu ” Xác suất bị bệnh tung thư trang cộng đẳng là 0.12” 
Chúng ta cũng có thể thể hiện phát biểu đó bằng một kỉ hiệu toán học: 
P(ung thư) = ũ.02. (P là viết tắt của chữ prohahility, tức xác suất). 

« Cách thử ha là dùng tỉ số khả dị (likelihood ratio}] bằng cách lấy số người 
bị ung thư chia cho số người không hị ung thư: 20/980 = 0.082 (tỉ số khả 
đĩ bị ung thư là 0.082). T1 số khả dĩ cảng cao, xác suất bị ung thư cảng cao, 
(Chủ ý: nếu tỉ số nảy là 1, điểu đó có nghĩa là xác suất bị ung thư là 0.5). 
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Như vậy, xác suất là tỉ lệ tấn số một sự kiện xảy ra. Đỏ là một định nghĩa xác 
suất cổ điển theo trưởng nhái tiếng Ảnh gọi là freqguecniisf nrabahility (tấn số xác 
suất). Nhưng cách định nghĩa dựa vào tấn số như thể, dù rất thông dụng trong 
sách giáo khoa về toán học và xác suất, nó có vấn để rất lớn trong việc diễn giải 
cho một cá nhân. Chẳng hạn như nếu tôi nói “Xác suất mà bạn bị ung thư là 
ũ.10” thì điểu đỏ có nghĩa là gi? Nó có nghĩa là trong 100 người như bạn, có 10 
người bị ung thư. Nói cách khác, nó là một con số áp dụng cho một quần thể, 
chứ không phải cho một cá nhân. Ấy thể mả câu phát biểu đó dùng cho một cá 
nhắn! Do đỏ, có người cho rằng một phát biểu như thể hoàn toàn vỗ nghĩa, bởi 
vì một cá nhãn là chỉ 1 cá nhãn, mà 1 cá nhân thi không có mẫu số. 


Một định nghĩa thử hai được để xuất tử thể kỉ 17 là trưởng phải xác suất chủ 
quan (suhjective nrobability). Then trường phải nảy, xác suất là một diễn đạt cá 
nhắn. Chúng ta sử dụng xác suất hàng ngày nhưng không để ý. Chúng ta vẫn 
thường nói “Hôm nay chắc trời miên quản, hay “Tôi thấy anh hình như bị cảm 
lạnh”. Đỏ là những cảm nhận cá nhân về một sự kiện, một tình trạng, nhưng là 
những cảm nhận không chắc chắn (tức bất định). Cách phát biểu như trên là 
một cách diễn đạt mỗi liên hệ của một cả nhân đổi với một sự kiện, nó không 
phải là một đặc tỉnh khách quan của sự kiện. Chính vì thể mả có người để nghị 
chúng ta nên nỏi ˆ xác suất về sự kiện” (nrohahility far an event), chứ không nên 
nói “xác suất sự kiện” (nrobahility oÝ an event). Xác suất, theo trường phải này, 
là một số da về sự hất định (degree of uncertainty}, hay một số đo vể mức độ tín 
tưởng (degree of belief). Quay trở lại câu nói ” Xác suất mà bạn bí ung thư là 0.10. 
theo cách hiểu nảy, là một cảm nhận chủ quan của cá nhẫn người phát biểu đến 
bệnh nhân. Không có cách gi để chứng mình câu phát biểu đó đúng hay sai 
(ngoại trừ xác suất là 0 hay 1). 


Những cần nhắc trên dẫn đến câu hỏi: phải truyển đạt kết quả xét nghiệm 
đến bệnh nhãn như thế nào để họ hiểu? Đã có nhiều nghiên cứu trong quả khứ 
để tìm cách truyển đạt thông tin cho bệnh nhẫn, nhưng dường như chưa ai nhất 
trí cách truyền đạt dễ hiểu nhất, bởi vì - như tôi vữa để cập - xác suất là một khái 
niệm tương đổi trữu tượng. Theo tôi, cách truyền đạt để hiểu nhất cho bệnh 
nhắn là dùng cách nói vỉ von về bệnh nhắn. Nếu PPV là 15%, chúng ta có thể nói 
cho bệnh nhãn biết răng, vỉ dụ như: ” Trang 10 người ở độ tuổi của ông, và nếu 
tất cả hạ cả kết quả xét nghiêm chủng tính, thì 15 người mắc bệnh. Tôi không biết 
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ông có năm trong số I5 người đá hay không. Nhưng qua xem xét các yếu tổ lâm 
sảng khác, tũi để nghị ông nên được điều trí” [Íỉ nhiên, quyết định cuối cùng vẫn 
là của bệnh nhãn - với sự giúp đũ của hắc sĩ. 

6. Diễn giải kết quả xét nghiệm 

Trong thực tế làm sảng, người thấy thuốc thường cần nhiều xét nghiệm, vả 
mỗi xét nghiệm đếu có độ nhạy và đặc hiệu thấn hơn 1Ũữ%M. Có hai loại xét 
nghiệm: xét nghiệm song song và xét nghiệm liễn tục nhau. Xét nghiệm song 
sang có nghĩa là nhiều xét nghiệm được tiến hành cùng một lúc. Xét nghiệm nỗi 
tiếp nhau có nghĩa là xét nghiệm 2 theo sau kết quả xét nghiệm l, và xét nghiệm 
3 theo sau kết quả xét nghiệm 2, v.v... Vì nhiễu kết quả xét nghiệm, vấn để đặt ra 
là điễn dịch các kết quả xét nghiệm này như thể nảo. 


Hi với xét nghiệm song song, nếu 2 nhương pháp xét nghiệm độc lập nhau 
(hiểu theo nghĩa kết quả của một phương pháp không cỏ mỗi tương quan với 
phương pháp kia), thì nhương pháp có độ nhạy cao nhất chỉnh là độ nhạy của cả 
hai. Chẳng hạn như nếu xét nghiệm 1 có độ nhạy là 60%, và xét nghiệm 2 có độ 
nhạy 80%, thì độ nhạy của xét nghiệm song song là 80%. Trong thực tế, rất hiểm 
thấy trưởng hợp hai xét nghiệm hoàn toàn độc lận nhau, cho nên phương pháp 
ước tính EPV từ xét nghiệm song song cẩn đến mỗ hình thống kê như mỗ hình 
hỗi qui lngistic. 

Xét nghiệm nỗi tiễn nhan (serial tests) thường có hiệu quả tăng độ đặc hiệu 
và PPV; nhưng giảm độ nhạy. Nói cách khác, nếu kết quả xét nghiệm theo chiến 
lược “nổi tiếp nhau” dương tỉnh, chúng ta tín tưởng hữn về khả năng mắc hệnh, 
nhưng cỏ nguy cơ người mắc bệnh hị bỏ sót và kết quả âm tỉnh. Xét nghiệm nổi 
tiến nhau có ích khi tất cả các xét nghiệm đểu không có độ đặc hiệu cao. 

Chiến lược xét nghiệm nối tiếp thưởng áp dụng khi yêu cẩu xét nghiệm 
không quả gấp, hay có những xét nghiệm quả đất tiền hay xâm phạm. Các xét 
nghiệm đắt tiền và xăm phạm chỉ thực hiện khi xét nghiệm đơn giản cho kết quả 
dương tỉnh. 

Vỉ dụ: Trong quấn thể có nguy cơ ung thư tiến liệt tuyển, tỉ lệ mắc bệnh là 
3.3%. Xét nghiệm PSA có độ nhạy là 67 và độ đặc hiệu là 97%. Xét nghiệm tiếp 
theo là DRE (dùng ngón tay) có độ nhạy là 50% và độ đặc hiệu là 943%. Cách ước 
tính PPV cho chiến lược xét nghiệm liên tục như sau: 
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Bước 1: tính PPV cho phương nhắp PSA 
s« €1ldds mắc hệnh trước khi xét nghiệm: 
(is. = 0.033 / (1 —- 0.035) = 0.034 
s [Rcho phương pháp PSA 
LR = 0.67 / (1 - 0.97) = 231.33 
s ldds mắc bệnh sau khi đã có xét nghiệm dương tính PSA: 
qÌ*s, = .034 x 22.33 =U./760 
«Xác suất mắc bệnh sau khi đã có xét nghiệm dương tỉnh PSA: 
PPV = 0.760 / (1 + 0.760) = 0.432 
Bước 1: tính PPV cho nhương nháp DILE 
s« (1dds mắc bệnh sau khi có xét nghiệm PSA: 
(is = ñ.432 / 1 - .432) = 0.760 
se LR cho phương pháp DRE: 
LR =U.50/ (1 - 0.94) = 8.33 
s Cldds mắc bệnh sau khi đã có xét nghiệm dương tỉnh PSA: 
ildls, = [I.760 x 8.33 = 6.33 
s Xác suất mắc bệnh sau khi đã có xét nghiệm dương tính PSA: 
PPV = 6.33 / (1 + 6.33) = 0.86 


Nói cách khác, trước khi có bất cứ kết quả nảo, xác suất mắc bệnh ung thư 
tiến liệt tuyển là 3.3%, nhưng sau khi kết quả xét nghiệm PSÀ dương tỉnh, xác 
suất tăng lên 43.3%. Sau khi đã có kết quả dương tỉnh từ DRE, xác suất mà hệnh 
nhắn mắc hệnh tăng lên 861. 


7. Cũ mẫu 

Các nghiên cứu tiên lượng và chẩn đoán cẩn phải được thiết kế theo các chuẩn 
mực khoa học. Trong các chuẩn mực này có việc xác định cũ mẫu cần thiết chủ 
một nghiên cửu có ý nghĩa. Thông thường các nghiên cửu về xét nghiệm được 
thiết kể then mỗ hình nghiên cứu bệnh chứng (case - control study), mà theo đó 
một nhỏm bệnh nhân đã được xác định có bệnh theo một phương pháp chẩn 
đoán chuẩn (gold standard), và một nhóm đối tượng không có bệnh. 
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Công thức xác định cữ mẫu cẩn thiết phụ thuộc vào 3 thông số: độ nhạy hay 
độ đặc hiệu cần tức tính; khoảng tin cậy của độ nhạy hay độ đặc hiệu; và thông 
số z tử luật nhãn phối chuẩn. Gọi độ nhạy hay độ đặc hiệu là n, khoảng rộng của 
tin cậy là m, và hệ số khoảng tin cậy từ luật phản phối chuẩn là z, công thức tiớc 
tính cỡ mẫu là: 

4x|l— z 
"= 

Chẳng hạn như nếu chúng ta muốn nghiên cứu về một phương pháp xét 
nghiệm mả chúng ta nghĩ rằng độ nhạy là 80% (p = 0.80), và khoảng tin cậy 951 
của thông số nảy dao động trong khoảng 0.75 đến 0.85 (tức w = ñ.10), với xác 
suất 959 (tức z = 1.96). Số cỡ mẫu cần thiết là 246 người: 

_ 4x0,8x(I—0.8)x(1.96} 


(0ÿ 
Nhưng chủng ta cũng cẩn ước tỉnh độ đặc hiệu, và giả dụ chúng ta cũng cẩn 
củ độ đặc hiệu là 0.8Ũ, thi số cỡ mẫu là 24õö. Tổng cộng chúng ta cẩn 492 đối 
tượng (346 bệnh nhân và 346 người không mắc bệnh) để nghiên cứu. 


=34o 


Bảng dưới đây trình bày số cũ mẫu cẩn thiết cho một thông số theo từng w 
khác nhau, với khoảng tin cậy 95%ú. 


Cũ mẫu cẩn thiết để ước tính độ nhạy hoặc độ đặc hiệu (p) 
Hộ rộng (width] của khoảng tín cậy 


L ao | u05 | aamo | ai | 0450 | a5 | 62m | 
Con um | | s | àp | 1 | Ho 
Lo [ng | m | | mm [5| 


Nỏi chung, cử mẫu cẩn thiết cho một nghiễn cứu đánh giả một phương pháp 
xét nghiệm cảng cao nếu độ nhạy và đặc hiệu cao, cũng như ở mỗi độ nhạy và 
đặc hiệu khi yêu cầu chỉnh cao (thể hiện qua độ rộng của khoảng tin cậy hẹp). 


CHÚ THÍCH 


[1] Như trường hợp của một bệnh nhãn, cứ gợi là Betty, như sau: Betty là một 
góa phụ 45 tuổi, với ba cạn, ở bang Florida (Mĩ). Một hôm vào tháng 11 năm 1590, 
Betty nhận được một cú điện thoại tử văn phòng y tế địa phương, yêu cầu chị đến 
trụ sở văn phòng, nơi mà chị từng đến khám bệnh tuyến giáp và thử máu. Khi chị 
phẻ sở y tế, bác sĩ cho chị biết rằng chị bị bệnh AT1DS. Bác sĩ không chắc là chị sẽ 
sẵng được bao lâu. Những tháng sau hung tin đỏ là những chuỗi ngày buồn rấu và 
lo lắng. Chị xem ti-vi liên tục để cổ tỉnh xua đuổi cái ý tưởng chị bị bệnh ÄTIDS ra 
khỏi tâm trí. Nhưng ái oäm thay, cải ý tưởng đỏ cử đeo đuổi chị mãi: chị sẽ mặc áo 
gì khi chết, con cái chị sẽ sống ra sao sau khi chị qua đổi, và bạn bè chúng sẽ nhìn 
chúng như thể nào? 


Năm 1882, bác sĩ cho chị dùng thuốc didanosine (một loại thuốc kháng HTV). 
Biến chứng của thuốc làm cho chị bị ói mửa thường xuyên, hay mệt mỗi, và vải vẫn 
để khác. Khi chị tham gia vào hội những người bị bệnh ATIDS ở địa phương, người 
cỗ vấn ở đó nhận thấy hàm lượng tế bảo T của chị khá cao. Họ để nghị chị nên đi tái 
khám. Tháng 11 năm 18835, Retty lại nhận một củ điện thoại từ sở y tế địa phương, 
yêu cầu chị ghẻ văn phòng sử sớm. Khi chị ghé văn phòng sỏ, chị được cho biết rằng 
kết quả thử nghiệm AIDS của chị là äm tính (tức là chị có thể không hị AIDSM 

Betty kiện bác sĩ, trung tâm thử nghiệm HIV: và sở y tế Florida ra tòa. Bồi thẩm 
đoàn hồi thưởng cho Betty 600000 Mĩ kăm vì đã phải chịu qua hai năm trời đau 
khổ với bản án y khoa không có thật (Trích từ sách: ÄTD5 npdate 1999: Án annual 
averview 0Í acquired inmmune deficiency syndrome của tác giả GỊ Stine (trang 359), 
Nxh Lipper Saddle River, N]: Prentice-Hall, 1999). 


[2| Tám lược cách ước tính các chỉ số chẩn đoán lắm sảng. Nếu một nghiên 
cứu được tiến hành theo thiết kể cross-sectian (nghiên cứu tiêu biểu một thửi điểm) 
trên N đối tượng, trong số nảy có n người thực sự mắc bệnh và m người không mắc 
hệnh. Nếu chúng ta xét nghiệm tất cả N đổi tượng, một số sẽ có kết quả dương tỉnh 
(+ve] và một số sẽ có kết quả äm tỉnh (-ve). Đối chiếu lại với bệnh trạng chúng ta 
có thể tắm lược như sau. 
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Kết quả chẩn đoản và bệnh trạng 


Trong bảng này, ä là số đối tượng có bệnh vả lết quả xét nghiệm +ve; h là số 


* " - F¿ 'S_ IF -IÊN. 
đổi tượng không có bệnh nhưng kết quả +ve; c là số đối tượng có bệnh nhưng kết B B GƯ L Œ 
quả -ve; và dỈ là số đối tượng không có bệnh và kết quả -ve. Ngoài ra, n = ñä + c, DIEN IÑ N HIEN U TIÊN L : N 1 
m=b+ d và N = n + m. Với các số liệu này, chúng ta có thể tính các chỉ số (tôi 


sẽ dùng tiếng Anh phụ) như sau: R0 (REGHVER ŨPERATING UHARACTERISTH 0) 


Tỉ lệ đương tính thật (sensitivity) 


Tï lệ âm tỉnh thật (snecificity) tiên lượng, với kết quả xét nghiệm mang tỉnh “nhị phân” (tức chỉ có hai 


T rong chương trước, tôi đã bản qua cách diễn giải kết quả chẩn đoản và 
giả trị dương tỉnh” hay “ảm tính”). Trong chương nảy, tôi sẽ hàn về cách 
diễn giải kết quả Hiên lượng của một yếu tổ có đơn vị đo lưững liên tục (còn gọi là 
Tï lệ dương tính giả (false nositive rate} cũntinuous variahle). Yếu tổ tiên lượng mang tính liên tục bao gốm những hiển 
như huyết áp, Insulin, gÌucose, creatinine, prastate-specilic antigen, v.v... Việc 
phân tích và diễn giải khả năng tiên lượng của các yếu tổ lãm sảng và sinh hỏa 
Tỉ lệ âm tỉnh giả (false negative rate} : cã này tương đối nhức tạn hơn là những biến nhị phản. 


Chẩn đoán là một qui trình bất định. Tỉnh bất định xuất phát tử phương 
pháp xét nghiệm, dù là xét nghiệm sinh hóa hay điện tử, ít khi nào có những kết 
quả chỉnh xác tuyệt đối. Do đó, kết quả chẩn đoán thường được diễn giải bằng 
xác suất. Chính vì thể mả William Chiler (1849 - 1919), một người thấy thuốc lớn 
của Mĩ từng nói một câu bất hủ: ” Mierdlicime ïs ä sciemce 0ƒ tmcerEainEw, qnÌ an arf 


0Ÿ prabalility" (y học là một khoa học hất định, và là một nghệ thuật xác suất). 


Trị số tiên đoán dương tính (PPV] 


Tỉ số khả dĩ dương tính (likelihœaod ratia +ve] 


1. Độ nhạy và đặc hiệu 


Một cách để xem xét mỗi liên hệ bất định giữa kết quả xét nghiệm và bệnh 
trạng là qua hiểu để 2x2 như sau: 


Tỉ số khả dĩ äm tỉnh (Iikelihood ratia -ve) 
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Mỏi cách khác, so sánh giữa kết quả xét nghiệm và bệnh trạng thực tế của 
hệnh nhãn, chúng ta có 4 tình huỗng khả di: 

s Hệnh nhän mắc bệnh, vả kết quả xét nghiệm là dương tính (dương tính 
thật hay true pasiiive] - không có vấn để gì; 

s« Hệnh nhän mắc bệnh, nhưng kết quả xét nghiệm là ảm tỉnh (còn gọi là 
tương tính giả hay false posifive); 

s® Bệnh nhãn không mắc bệnh, vả kết quả xét nghiệm là âm tỉnh (âm tỉnh giả 
hay aÌse ngựniiwe)}; 

« Bệnh nhãn không mắc bệnh, nhưng kết quả xét nghiệm là ãm tỉnh (còn 
gọi là ẩm tính thậi hay true negaiive]; 


Tï lệ dương tính thật, dương tính giả, ảm tính thật, và äm tính giả có thể 
ước tính qua các nghiên cứu tiên lượng. Cách tỉnh các chỉ số này đã được mô tả 
trong hải trước, nên chúng ta sẽ không lặp lại ở đây, chỉ xin nhắc lại một vải điểm 
chính: tỉ lệ dương tính thật được gọi là độ mhạy hay sensitivity; tỉ lệ âm tỉnh thật 
được gọi là độ đặc hiệu hay specificity. Việc chọn phương pháp có độ nhạy hay 
độ đặc hiệu cao tùy thuộc vào tình hình thực tế của bệnh và nhất là tùy thuộc 
vào sự trả giá cho “sai lầm”. 

Sử dụng xét nghiệm có độ nhạy cao. Phương pháp có độ nhạy cao cho phép 
chúng ta loại bỏ khả năng mắc bệnh. Da đỏ, nên chọn phương pháp xét nghiệm 
củ độ nhạy cao nếu hỏ sót bệnh dẫn đến hệ quả nghiễm trọng cho hệnh nhẳn. 
Chẳng hạn như nếu có lí do để nghỉ ngờ rằng một bệnh nguy hiểm (như lao 
phối, chứng huyết khối tĩnh mạch sảu [deep vein thromhosis hay DVT], bệnh 
Hodpgkin, v.v... }, chúng ta cẩn phương pháp xét nghiệm cỏ độ nhạy cao, để loại 
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trử khả năng bệnh nhãn mắc bệnh với kết quả âm tính. Trong trường hợp khác, 
chúng ta nên chụn xét nghiệm có độ nhạy cao như kháng HIV để loại trừ nhiễm 
trùng liên quan đến AIDS. Nói tóm lại, một phương pháp xét nghiệm có độ nhạy 
can rất có ích cho người thấy thuốc khi kết quả xét nghiệm là äm tỉnh. 


Sử dụng xét nghiệm có độ đặc hiệu cao. Phương pháp xét nghiệm đặc hiệu 
can có nghĩa là nếu đổi tượng không có bệnh, phương pháp xét nghiệm ít khi 
nào cho ra kết quả dương tính. Điểu này có nghĩa là các xét nghiệm có độ đặc 
hiệu cao rất có ích cho việc xác định bệnh trạng. Chẳng hạn như trong trường 
hợp DWVT: xét nghiệm I1-dimer không có độ đặc hiệu cao (khoảng 63%); do đỏ, 
khó mả quyết định điểu trị cho dù kết quả xét nghiệm là dương tính. Tất cả các 
hệnh nhãn có kết quả xét nghiệm dương tỉnh thưởng được xét nghiệm tiến tục 
bằng siêu äm (cormpression uÌtrasonography) - một phương pháp có độ đặc hiệu 
cau. Các xét nghiệm đặc hiệu cao rất cẩn thiết khi kết quả dương tỉnh giả dẫn 
đến hệ quả nghiêm trọng cho bệnh nhân. Chẳng hạn như trước quyết định hóa 
học trị liệu cho bệnh nhãn, các phương pháp xét nghiệm mỗ (tissue tests) cẩn 
phải được tiễn hành. Nói tóm lại, phương pháp xét nghiệm đặc hiệu cao rất có 
ích khi kết quả xét nghiệm là dương tỉnh. 


Cân bằng giữa độ nhạy và đặc hiệu 


Một phương pháp xét nghiệm lí tưởng có độ nhạy và đặc hiệu gẩn 1ŨữM. 
Nhưng trong thực tế, ít khi nào chúng ta có một phương pháp xét nghiệm hoàn 
hản như thể. Có những xét nghiệm có độ nhạy can, nhưng độ đặc hiệu thấp (vá 
ngược lại). Dao đỏ, vấn để là cẩn phải cân bằng giữa hai khía cạnh nhạy và đặc 
hiệu của một phương pháp xét nghiệm, nhất là trong trường hợp kết quả xét 
nghiệm là một hiến liên tục. 

Trong trưững hợp kết quả xét nghiệm có nhiễu giả trị (biển liên tục}, việc xác 
định một giá trị tham chiếu (reference cut-off value) để phản hiệt giữa “dương 
tính” và “äm tỉnh” (hay giữa “bình thưởng” và “bất bình thưởng”) là điểu rất quan 
trọng. Thông thường, một xét nghiệm có nhiều giả trị liên tục, độ nhạy và độ đặc 
hiệu thưởng thay đổi nghịch chiếu. Như là một qui luật, khi độ nhạy tăng thì đã 
tặc hiệu giảm; ngược lại, khi độ nhạy mảm thì độ đặc hiệu tăng. Không có cách gì 
để gia tăng độ đặc hiệu và độ nhạy trong củng một lúc cho một xét nghiệm. 


Số liệu sau đảy (Bảng 1) cho thấy mỗi liên hệ giữa xét nghiệm PS5A (prostate- 
specihc antigen)} và ung thư tiến liệt tuyến ở đàn ông Mi trong độ tuổi 7Ú. Nếu 
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giả trị tham chiếu được chọn là z 3 ng/mL thì độ nhạy là 100%, nhưng độ đặc 
hiệu chỉ 60%. Điểu này có nghĩa là dương tỉnh giả lên đến 401:, tức rất nhiều 
người có kết quả “dương tỉnh” (trên 3 ng/mL) nhưng họ không bị ung thư. Nếu 
chọn giá trị tham chiếu là => 13 ng/mL thì độ đặc hiệu là 97% nhưng độ nhạy chỉ 
23; nói cách khác, xét nghiệm hỏ sút 779% người mắc bệnh! Các tác giả để nghị 
lấy giá trị tham chiểu là > 5.5 ng/mL vì ở ngưỡng này, độ nhạy là 95% và đặc hiệu 
là 7B%, tức có thể chấp nhận được. 


Bảng 1. Độ nhạy và đặc hiệu của xét nghiệm DSA 
trung tiễn lượng ung thư tiễn liệt tuyến ở đản ủng người Mĩ da đen 


PSA (ngJmL) Độ đặc hiệu 
>1 | 10 | 021 —— 


Nguấn: Täi liệu tham khảo [1] 


2. Biểu đồ ROC và AUC 


Một cách khác để mô tả mỗi liên hệ giữa độ nhạy và đặc hiệu là biểu để RCX 
(receiver onerating characteristic) [2]. Biểu để ROX? có nguồn gốc quản sự, vì nó 
được ng dụng trong việc phát hiện tàu của địch trên mản hình radar trong Thể 
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chiến thứ II, nhưng trong thời gian ba thập niên qua, biểu để ROKC đã được ứng 
dụng trong chẩn đoán vả tiên lượng y khoa rất thành công. 


Biểu đỗ ROC có trục tung (y-axis) là tỉ lệ dương tính thật, và trục hoành 
(x-axis) là tỉ lệ dương tính giả (tức 1 trừ cho độ đặc hiệu). Cả hai tỉ lệ dĩ nhiên 
có giá trị dao động từ ñ đến 100 (hay từ ñ đến 1, nếu dùng xác suất). Hai tỉ lệ 
này được ước tỉnh cho từng giá trị tham chiếu. Phương pháp xét nghiệm tốt sẽ 
củ những điểm tham chiếu tận trung vào khu vực ” Tây Bác, tức là những điểm 
ở gúc trải thuộc phía trên của hiểu để. Những điểm nảy cho chúng ta biết đỏ là 
những giả trị tham chiếu có độ nhạy cao và độ dương tính giả thần. Biểu đồ 1 
dưới đây thể hiện sẽ liệu từ Bảng 1. 


Sensitivity 


Ũ ũ.2 ũ.4 ũ.Ê ũ.8 1 
False positive (1-speeifieily} 


Biếu đổ 1. Hiểu dễ ROC thể hiện dương tỉnh thật [trục tung] 
và dương tỉnh giả [trục hoành] của xét nghiệm P5Ä 
trong phát hiện ung thư tiền liệt tuyến ở dàn ông Mĩ da đen trang độ tuổi 70. 


Băng cách nối kết các điểm trên biển đổ RCX, chúng ta sẽ có một biểu đổ ROC 
liên tục như trình bảy trên. Nhưng ở đây chúng ta có hai chỉ số ( độ dương tỉnh giả 
và độ nhạy), và chúng biển thiên ngược chiểu nhau. Do đỏ, chúng ta cẩn một “chỉ 
số dung hùa” cả hai chỉ số này. Một cách quản bình hóa tốt nhất là tức tỉnh diện 
tích dưới đường biểu diễn ROC: (củn gọi là area nmder thế cúrve - AUC]. 


Area under the curve 


Biểu để ROKC có thể xuất hiện dưới nhiều tình huống như thể hiện qua Biểu 
đỗ 2. Nếu độ nhạy là 100% và tỉ lệ dương tỉnh giả là 0%, chúng ta kỉ vọng điện 
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tích AUC là 1 (diện tích hình vuông). Nếu phương pháp xét nghiệm vỗ dụng 
thì tất cả các điểm tham chiếu đều năm trên đường thẳng nối hai điểm (Ũ, ñ} và 
(1, 1), tức đường 45 độ, và trong trưởng hợp nảy, AUC phải bằng Ú.5. Nhưng 
trong thực tế thi đường ROC thường như hình có AUC 0.9 hay 0.65. Diện tích 
dưới đường hiểu diễn có thể tỉnh toán bằng phương pháp tích phản, nhưng 
trong thực tế thi có những chương trình máy tỉnh tính chính xác hơn. 


Biểu đã 2. Diện tích dười dường biểu diễn [AUC] của biểu dễ RC. AUC tối da là 1, 
tối thiểu là 1.5. AUC = 0.8 dược xem là rất tốt, AUC = 0.65 dược xem là không tốt. 


Một phương pháp xét nghiệm có ích phải có điện tích AUC trên 0.5. Không 
củ ngưỡng nảo của AUC để xác định là một xét nghiệm tuyệt với. Tuy nhiên, 
theo qui ước thì một phương phán xét nghiệm với ÀUC trên 0.8 được xem là tốt 
hay rất tốt; còn AUC dưới 0.6 được xem là không tốt và không thể án dụng vào 
lãm sảng được (Bảng 2) [5]. 

Bảng 2. Diễn giải ý nghĩa của điện tích dưới đường biểu diễn ROC (AUC) 


Yo dung đan 
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Chỉ số AUC rất có ích trong việc so sánh độ chính xác của hai hay nhiều 
phương nháp xét nghiệm. Cố nhiễn, phương pháp nào có AÙC cao hưữn có nghĩa 
là phương pháp đỏ có độ chỉnh xác cao hơn. 


3. Ý nghĩa của AUC 


Diễn giải ý nghĩa của AUC như thể nào? Sách giáo khoa tiếng Anh thường 
định nghĩa AUC như sau ”“Prahahility that ä randnmily selected nam nƑ henlthy 
individual and patient, thể test result wilÏ be higher ím thể patient than ím the 
henlthy rmdivilual” (xắc suất mà một cặp đôi, một với bệnh và một bình thưởng, 
được chọn ngẫu nhiên trong cộng đẳng, và kết quả xét nghiệm của bệnh nhắn 
cao hơn người bình thưửng). Chúng ta cỏ thể lấy một ví dụ để mình họa: nếu 
chúng ta chọn một cặp đối tượng (chọn một cách ngẫu nhiên tử một quần thể), 
một người có bệnh và một người không có bệnh; nếu cả hai người đếu được xét 
nghiệm hãng một phương nháp có AUC = B5, thì điểu này có nghĩa là xác suất 
mả người có bệnh có kết quả xét nghiệm với giá trị cao hơn người không mắc 
hệnh là 851. 

Một cách khác để hiểu ý nghĩa của AUC là qua khái niệm concordance / 
discordance. Thử tưởng tượng chúng ta có một phương pháp tiên lượng bệnh, 
và kết quả tính toán là xác suất. Dĩ nhiên, nếu giá trị tiên lượng cảng cao, nguy 
cử mắc bệnh cảng cao. [a đó, nếu một cặp cá nhẫn, một người mắc hệnh và một 
người không mắc bệnh, và nếu 


s giá trị tiên lượng ở bệnh nhản cao hơn giá trị tiên lượng ở người bình 
thường, chúng ta xem đỏ là cancorrkanf; 


s giả trị tiên lượng ở bệnh nhãn thấn hơn giá trị tiên lượng ở người bình 
thường, chúng ta xem đó là discprrlant; 


s_ giả trị tiên lưựng ở bệnh nhãn bằng giả trị tiên lượng ở người bình thưởng, 
chúng ta xem đỏ là ire. 


AXUC có thể xem là tỉ lệ số cập concordant trên tổng số. 


Vi dụ: Chúng ta có 7 nam bệnh nhãn được theo đỗi 5 năm. Trong thời gian 
đó, 4 người mắc bệnh ung thư tiển liệt tuyển, và 3 người không mắc bệnh. Gii 
trị PSA của 4 người mắc bệnh là: 


8,2,6, 3 
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và PSA của 3 người bình thường lả: 
3,3,6 
Như vậy chúng ta có tất cả 4 x 3 = 12 cặp khả dĩ. Biểu đỗ dưới đây mình họa 
cho cách bắt cặp. Chẳng hạn như bệnh nhân có PSA 8 có thể bắt cặn với người bình 
thưởng có ESA 3, 2, 6. Với cá nhân có PS5A băng 3, chúng ta có một concordant (vì 
8 cao hơn 3). Tương tự cho cá nhân có PSA bằng 2 và 6, cũng là concordant. 


Bệnh nhắn ưng thư HT H1... -.r. 


bị) = 3 Canicordant [E > 3] 
Ạ Fì Cancordant [B > 3] 
B k Š Cancprdant ( > É] 
3 


tung thư ' Ghi thú 


8 ` Discordant [2 < 3] 
, —= : Tie {2 = 2] 

b h Dlscozdant (3 < É] 
3 


Đến bệnh nhân có P5A = 2, khi bất cặp với cá nhãn có PSA bằng 3 và 6, 
chúng ta có 3 discordant, còn với cá nhân có PSA = 2, chúng ta có một te. 


Tương tự bát cặp cho bệnh nhân với PSA = 6 và PSA = 3 như biểu đổ dưới đây: 


mg ung thư | Ghhị chủ 


8 Ƒ_—> 1 Concordant | > 3} 
? == — ? Concordant (Š > 3| 
Ế k * Š Tie [6 = 6] 

3 

& -_ 1 Tie [3 = 3| 

ra : ta Ennecnrdant |3 > 3] 
B — . B Discardarit [3 « É} 
P 


'Tổng cộng chúng ta có 12 cặp, trong đó có 6 concordant, 3 điscordant và 3 te. 
Ba tie được tỉnh là 1.5 cancordant (và 1.5 discordant]. Dao đó, AUC được tỉnh là 
(B + 1.5)/12 =0.625. Như vậy AUC chính là chỉ số dùng để đo lưỡng độ chính 
xúc của sự phân định (discrimination) giữa bệnh vả không hệnh. 


- 1390 - 


4. Hiểu y văn 

Ngày nay, có rất nhiều phương pháp xét nghiệm được phát triển và được 
quảng bá rắm rộ. Nhưng phần lớn những phương pháp mới được quảng bá 
không hẳn tốt hơn phương pháp cũ (qua đánh giả của chỉ số AUC), đó là chưa kể 
đến chi nhỉ xét nghiệm của những phương phản mới thưởng đất tiến hơn những 
phương pháp cũ. Một đặc điểm khác là khi mới được giới thiệu, các phương 
pháp xét nghiệm đều có chỉ số ÄUC cao, nhưng khi kiểm định lại đ một hay 
nhiều quấn thể đặc lập khác thi độ chỉnh xác không tuyệt với như lúc ban đầu! 

Tình trạng thiểu nhất quán nảy xảy ra vi vấn để thiết kế nghiên cứu. Nhiều 
nghiên cứu tiên lượng dựa vào bệnh nhân ở bệnh viện và nhỏm chứng thường là 
sinh viên y khoa khỏe mạnh. Đây là những đối tượng khả “tương phản” nhau về 
sức khỏe, cho nên kết quả thường “tốt” hơn khi xét nghiệm được áp dụng ở một 
quấn thể đa dạng trong mỗi trưởng lắm sảng, nhất là ngoài cộng đẳng. 

Ngoài ra, một số người mặc dù không có bệnh nhưng có thể có vẫn để sức 
khỏe khác và da đó có kết quả xét nghiệm “dương tính, vì thế gia tăng tỉ lệ dương 
tính giả và giảm tỉ lệ äm tỉnh thật. Chẳng hạn như CEA (carcinoemhryonic 
antigen) - một xét nghiệm cha ung thư ruột - thường tăng cao ở những hệnh 
nhắn xơ gan vả viêm kết trảng; và nếu những bệnh nhãn nảy được xét nghiệm 
như là nhám chứng thì tỉ lệ dương tỉnh giả sẽ tăng, độ đặc hiệu sẽ giảm. 

Dao đá, để đánh giá một phương pháp xét nghiệm mới, chúng ta cẩn phải trả lời 
cho được một số câu hỏi quan trọng như sau: Phương pháp xét nghiệm đã được 
kiểm định trong nhiều quần thể độc lập hay chưa; có chẩn đoán “tiêu chuẩn văng” 
để làm tham khảo; nhương pháp xét nghiệm đã được thẩm định trong một nhỏm 
đổi tượng thích hựp, như ngoài cộng đồng hay chưa; phương nháp được mỏ tả chỉ 
tiết và cụ thể; độ nhạy, đặc hiệu, và chỉ số ADUC? Chỉ khi nảo các cầu hỏi trên được 
trả lời thỏa đáng thì phương pháp xét nghiệm mới có thể ứng dụng vào lắm sảng. 


Kết luận 


Tiên lượng và chẩn đoán đóng vai trò rất quan trọng trong thực hành lâm 
sàng, nhưng điểu khó khăn là vấn để diễn giải kết quả nghiên cứu và án dụng 
cho một bệnh nhãn. Vấn để cảng khó khăn hơn đối với các phương pháp xét 
nghiệm có kết quả là một biến liên tục (thay vì một biến nhị phân). Đối với các 
xét nghiệm có nhiễu giả trị, phương pháp đánh giá độ chính xác của xét nghiệm 
là dựa vào sự quản hình giữa độ nhạy và độ đặc hiệu cho từng giả trị tham chiếu, 
và thể hiện bảng chỉ số AUC. Tuy AUC (diện tích dưới đường hiểu diễn RÖOC) 
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là một chỉ số quan trọng và có ích cho việc đánh giá sự hữu hiệu của một xét 
nghiệm, nhưng phần lớn diện tích nảy xuất phát tử các giá trị dương tỉnh giả. 


Như để cập, ADC là một chỉ số có thể sử dụng để so sánh các nhương pháp xét 
nghiệm. Nhưng vi một nhân lớn của AUC chịu sự chỉ phối của tỉ lệ đương tỉnh 
giả, cho nên nói chung AUC rất thiểu tính nhạy. Chẳng hạn như nếu xét nghiệm 
thứ nhất có AUC: là 0.80, và nếu thêm xét nghiệm thứ hai AÙC tăng lên 0.83, thi 
điều đỏ không có nghĩa là xét nghiệm thử hai góp phần khiêm tốn vào tiên lượng, 
mả vì chỉ số ADC thay đổi rất nhỏ. Vải năm gắn đây, các nhà nghiền cứu đã phát 
triển một số nhương pháp phân tích mới để đánh giá các xét nghiệm mi so với 
các xét nghiệm chuẩn, và các phương nháp phần tích mới này đang dẫn dẫn được 
áp dụng rộng rãi trong y văn, nên chúng ta có lẽ sẽ quay lại một bài sau [4-5]. 

Cần ghi nhận rằng các chỉ số như độ nhạy, đặc hiệu, hay AUC phản ảnh độ 
chỉnh xác của phương pháp xét nghiệm; chúng không cung cấp xác suất mắc 
hệnh cho một cả nhân. Để ước tính xác suất nảy chúng ta cẩn một thông số quan 
trọng: đó là tỉ lệ lưu hành (prevalence) hoặc tỉ lệ phát sinh (Incidence}] của bệnh. 
Thông số này cẩn kết hợp với các chỉ số về độ chính xác của phương pháp xét 
nghiệm để cung cấp một chân đoán hay tiên lượng cho bệnh nhân. Nghệ thuật 
xác suất trong y khoa chính là ở khía cạnh áp dụng nhuẩn nhuyễn các chỉ số này 
nhằm nẵng cao tỉnh chỉnh xác của chẩn đoán vả tiên lượng. 
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DIỄN GIẢI KẾT QUẢ NGHIÊN CÚU 
THE0 TRƯỜNG PHÁI BAYES 


ột trong những cầu trả lời quan trọng nhất mà người đọc kết quả 
M một cũng trình nghiên cửu lãm sàng đối chứng ngắu nhiễn 

(randamized contrnlled trial - RCT}] muốn có là: với những dữ liệu 
thu thập dược, xác suất mà nhưng phản điều trị cô hiệu quả là ban nhiều? Tuy 
nhiên, phương pháp phân tích thông dụng hiện nay lại nhằm trả lời một câu 
hỏi ngược lại: nếu phương pháp điểu trị không có hiệu quả, xác suất mà đữ 
liệu này xuất hiện là han nhiều. Phương pháp hiện hành đã gãy ra nhiễu nhẩm 
lẫn trong việc diễn giải kết quả nghiên cửu. Hiện nay, các nhà nghiên cứu đang 
chuyển sang một phương pháp phản tích và diễn giải khác để trả lời cầu hỏi má 
nhà nghiên cứu cẩn biết. Phương pháp “mới” này dựa vào trưởng phải thống kế 
Bayes (Bayesian statistics). Trong chương nảy tỗi sẽ giải thích suy luận và điễn 
giải kết quả RCT theo trưởng phải Bayes. 


Trong khoa học, có hai trưởng phải thống kê học: trường phải tấn số hay cổ 
điển (Íreqguecntisi, hay classical siniisHics) và trường phải Bayes (Bayesian siafisHics). 
Hai trưởng phái thống kế học này khác nhau về triết lí khoa học và nhất là cách 
hiểu khải niệm xác suất. Nói một cách ngắn gọn, trường phái thống kê cũ điển xem 
xác suất là một tấn số của một sự kiện xảy ra, còn trưởng phải Bayes xem xác suất 
là một thước đo về tri thức [1]. Chẳng hạn như trước phát biểu “xác suất một bệnh 
nhân mắc hệnh xơ vữa đẳng mạch là 1W” trường phải thống kẻ cổ điển điễn giải 
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rằng về lâu về đải trong số 100 người thì có 10 người mắc bệnh, còn trưởng phải 
Bayes xem đỏ là một cảm nhận cả nhân vỀ nguy cơ mắc bệnh, và vi mang tính cá 
nhãn nên xác suất theo Bayes là cảm nhận chủ quan (suhjectivist probability). 

Do đả, ý tưởng căn bản của trường phải thống kẻ Bayes là các thông số như 
trung binh, tỉ lệ, độ lậch chuẩn, v.v... có những luật phân phối riêng. Các luật 
phân phối này chẳng những thể hiện tỉnh trạng bất định của các thông số, mà còn 
phản ảnh kiến thức của chúng ta về các thông số đá. Đối với trưởng phải thống kẻ 
cổ điển, các thông số này là cố định, không có luật nhản phối. Đây chính là điểm 
khác biệt cơ bản mang tính toán học giữa hai trưởng phải thống kê. 


Suy luận theo trưởng phải Bayes thật ra không phải là một điểu xa lạ đối với các 
hác sĩ lãm sảng. Hi với các bác sĩ lắm sảng, trước một liết quả xét nghiệm, điểu mã 
hác sĩ cẩn biết là khả năng (hay xác suất] mà cá nhân mắc bệnh là bao nhiều. Để 
ước tính xác suất nảy, bác sĩ cần phải có thông tin nền (hackground information} 
về hệnh, độ nhạy vả tỉ lệ dương tính giả của phương pháp xét nghiệm. Với ba 
thông tin nảy, bác sĩ có thể ước tính xác suất cá nhân mắc bệnh là bao nhiêu. Đá 
chỉnh là cách suy luận và diễn giải kết quả xét nghiệm theo trưởng phải Bayes, dủ 
sách giáo khoa y khoa it khi nào sử dụng đến thuật ngữ Bayes [2-3]. 


Diễn giải kết quả nghiên cứu lâm sàng theo trưởng phái Bayes cảng ngày 
cảng phổ biển [4-11|. Trong chương về kiểm định giả thuyết, tôi đã bản qua 
những vẫn để của trị số P và khiếm khuyết của trưởng phải thống kẻ cổ điển. 
Thật ra, những vấn để của trị số P đã được nêu lên từ những 5Ũ nắm qua trong y 
văn, vả miởi nghiên cứu y khoa cảng ngày cảnh nhận thức được những hạn chế 
của nó. Trang khoảng ha thập niên trở lại đây, giởi nghiên cửu cảng quan tắm 
đến việc ứng dụng định lí Bayes trong diễn giải kết quả nghiên cửu. Có người 
cho răng trưởng nhải Bayes sẽ “thống trị” nghiên cứu khoa học trong thể kỉ 21 
(cũng giếng như trưởng phải thống kẻ cổ điển thống trị khoa học trong thể 
ki 20). Do đá, trong chương này tôi sẽ bản về cách diễn giải kết quả nghiên cứu 
lãm sảng theo trưởng phải Bayes. 


1. Khái niệm Bayes qua qui trình tiên lượng 


Có lẽ cách tốt nhất để làm quen với trường phải Bayes là qua vỉ dụ về tiên 
lượng hệnh [3]. Tập san New Engiand ]aurnal nƒ Medicine mới công bổ một công 
trình nghiên cứu về tiền lượng bệnh lao phối (TE) ở những bệnh nhân nhiễm 
HIV. Trong cũng trình nghiên cứu, họ thu thập dữ liệu từ 1748 bệnh nhân HIV 
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ï 3 nước Thải Lan, Campuchia, và Việt Nam; trong số này có 267 người (hay 
15,2) được chẩn đoán có TB và I4BI không có TB. Để đánh giả giả trị tiên 
lượng của các triệu chứng lắm sảng, các nhà nghiên cứu hỏi mỗi bệnh nhãn HIV 
củ những triệu chứng như ho trong vòng 4 tuần qua, hoặc sốt trong vòng 4 tuần 
qua, hoặc ra mổ hỗi ban đêm từ 3 tuần trở lên. Kết quả cho thấy: 


s trong số 267 người có TE, có 248 người có ít nhất 1 triệu chứng; nói cách 
khác, độ nhạy (sensitivity) là 249 J 267 = 93.2%; 


s trong số 1481 người không có TR, 950 người cỏ ít nhất l triệu chứng (và 
531 người không cỏ triệu chứng]; tức độ đặc hiệu (specificity) là 5351/1481 
= 3h5.BM. 


Câu hỏi đặt ra là: Nếu hác sĩ gặp một bệnh nhãn nhiễm HIY, và nếu hệnh 
nhắn có một trong những triệu chứng trên, thi xác suất tiên lượng mà bệnh nhẫn 
mặc bệnh TB là bao nhiều? 


Chúng ta biết răng, trước khi có thông tin về triệu chứng lãm sàng, xác suất 
bệnh nhãn có TRE là 15.2%, vì đỏ là thông số chung của quần thể. Thuật ngữ 
của trưởng nhải Bayes gọi thông số nảy là prior information hay thông tín 
tiến định. Trung hổi cảnh tiền lượng, prior information chính là tỉ lệ hiện hành 
(prevalence). 


Mếu sau khi khám, bệnh nhân có ] trong những triệu chứng trên, thì xác suất 
mắc bệnh không củn là 15.2%, mả là một ước số khác. ức số tiên lượng này có 
thể tỉnh dễ dàng bằng định lí Bayes. Định lí Bayes phát biểu răng xác suất mả 
bệnh nhãn mắc bệnh TE tùy thuộc vào 3 thông số: (a) thông tin tiến định; (h) độ 
nhạy; vả (c} độ đặc hiệu, hoặc đương tỉnh giả (false positive). Để khỏi dài dong, 
cỏ thể tạm gọi: 

s thông tin tiển định là nriør, 


s độ nhạy là se, 
« độ đặc hiệu sỹ, 
« xác suất mắc bệnh sau khi biết se và sp là posterior probahility. 
Định lí Bayes phát biểu như sau: 
pusierior =- .... 


( prior xse]+[L— priar}<(1— sp} 
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Theo nghiên cứu trên, priar = Ú.152, se = (.932, và sp = 0.358. Do đá, xác suất 
mả bệnh nhän mắc bệnh T là 0.2306 hay khoảng 21: 

.153x0.”32 
tử. “——————————--—.--0t 
Power — (6152x0932)20-0152)x0-0358) 

Thuật của Bayes gọi xác suất mắc bệnh sau khi đã biết độ nhạy, độ đặc hiệu và 
thông tin tiển định là xác suất hậu định (posterior probability), hay trong thuật 
ngữ chẩn đoán là giả trị tiên lượng dương tính (nositive nredictive value, PPV). 

Mếu gọi hiện tượng mặc bệnh TE là D, có triệu chứng là posifive, và không có 
triệu chứng là negative, những thông số trên có thể thể hiện bằng ngôn ngữ của 
xúc suất như sau: 

« độ đặc hiệu : sp = Pr| negafive | notl1) 

s độ nhạy : se = PT posifive | D] 

s« xác suất hậu định hay : P = Pr(D | positive) 

Chú ý rằng Pr có nghĩa là xác suất, và dấu ”|” có nghĩa là “với điểu kiện” Do 
đó, khi viết se = Pr( positive | D) có nghĩa độ nhạy là xác suất mà bệnh nhãn 
có triệu chứng lãm sảng dương tính nếu hệnh nhân mắc bệnh TT. Xác suất này 
rất khác với PPV màả ý nghĩa là xác suất bệnh nhân có TR nếu triệu chứng lãm 
sàng là dương tỉnh. 

Với cách diễn đạt trên, nếu xem độ nhạy và độ đặc hiệu là bảng chứng 
(evidence), thi PPV hay xác suất tiên lượng hậu định có thể mö tả theo công 
thức chung như sau: 

[Xác suất hậu định | = [Xác suất tiền định | x [Bằng chứng] 

Đây chính là định lí Bayes được phát biểu bằng một ngôn ngữ để hiểu nhất. 
Diễn giải kết quả nghiên cứu lãm sảng cũng không khác mấy với diễn giải kết 
quả tiền lượng và chẩn đoán. Thay vì tìm hiểu có bệnh hay không có bệnh, 
nghiền cứu lãm sảng tìm hiểu giả thuyết đúng hay sai; độ nhạy chính là pawer, 
và tỉ lệ dương tỉnh giả cỏ thể (xin nhấn mạnh: có thể) xem tương đương với trị 
số P trong nghiên cứu lâm sảng. 


2. Giả thuyết và bằng chứng 


Tất cả các công trình nghiên cứu lãm sàng đối chứng ngẫu nhiên (RCT} đếu có 
mục tiểu kiểm định một giả thuyết khoa học (hay củn gọi là test of hypoathesis). 
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Chẳng hạn như nghiên cứu về hiệu quả của ramipril [12] trang việc phòng ngừa 
tử vung, giả thuyết đặt ra là ramipril mảm nguy cơ tử vong. Tạm thửi đặt kỉ hiệu 
giả thuyết là H. 

Sau khi thu thập và phản tích dữ liệu, các nhà nghiên cứu phát hiện rằng 
tỉ số nguy cơ tương đối |relative risk] tử vong ở bệnh nhân được điểu trị bằng 
ramipril là 0.84 (với khoảng tin cậy 85% là 0.75 đến 1.95; P = 0.005). Có thể xem 
đây là dữ liệu thật, là bằng chứng, với kí hiệu E. 

Với bằng chứng trên đây, có thể kết luận rằng ramipril giảm nguy cơ tử vong? 
Câu trả lời đưn giản là: chưa. Chưa là vì nhiều lí do, trong đỏ có lỉ do dữ liệu. Trị 
số P = [005 cỏ nghĩa là nếu giả thuyết H (ramipril giảm tử vong] là sai, thì xác 
suất má bảng chứng E (tức ramipril giảm tử vong} xảy ra là 0.005 hay 0.5%. Da 
đó, trị số P không nói cho chúng ta biết gì về mức độ khả đi của giả thuyết H. 

Trong nghiên cửu lãm sảng câu hỏi cẩn đặt ngược lại là: với bằng chứng È, 
xác suất mà giả thuyết H đúng là bao nhiêu? Nói cách khác, chúng ta cẩn biết 
xác suất hậu định của giả thuyết H. Để trả lời câu hỏi quan trọng trên, chúng ta 
cần đến định li Eayes. Như mỏ tả qua vỉ dụ về tiên lượng, xác suất hậu định của 
giả thuyết H tùy thuộc vào xác suất tiền định của H và bảng chứng E. Viết then 
ngũn ngữ xác suất, phát biểu trên là: 

Pr(H|E)]=Pr(H]xPr(E|H] [1| 

Công thức trên có 3 về mà tôi sẽ giải thích như sau: 

e« Thứ nhất, Pr(H | E) là xác suất hậu định của giả thuyết H hay posterior 
probability. Pr(H | E) là xác suất mả giả thuyết H đúng với điểu kiện bằng 
chứng E (cũng giỗng như xác suất mắc bệnh nếu có triệu chứng lãm sảng). 

s Thứ hai, tương tự như trong ví dụ về tiên lượng TB, nếu Pr(D) là xác suất 
mắc hệnh trước khi có thông tin về triệu chứng, thì Pr(H} là xác suất giả 
thuyết H đúng trước khi chúng ta có bảng chứng E. Pr(H} còn được gọi là 
prior information hay prior probability (xác suất tiến định). 

« Thử ba, Pr(E | H) chính là xác suất về băng chứng xảy ra nếu giả thuyết H 
đúng, và thuật ngữ Bayes gọi là likelihood hay khả đi. 


Phát biểu [I | trên cũng có thể viết theo ngôn ngữ Bayes như sau: 
[posterinr prohalnlity] = [prior probahility] x [Likelihood] 
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2.1. Xác định Pr{H) 


Trong phát biểu trên, chúng ta đã biết Pr(E | H), nhưng chưa biết Pr(H), tức 
xúc suất mả giả thuyết HH đúng là bao nhiễu. [Da đỏ, vấn để then chốt là làm sao 
xác định Pr(H), và đây chính là vấn để gây ra nhiều tranh cãi đai dẳng trong 
trưởng phải Bayes. Tuy nhiên, đối với những nghiên cứu lãm sảng, trước khi 
tiến hành nghiên cửu, các nhà khoa học thường có vải ước tính về khả năng của 
một giả thuyết. 

Trong các nghiên cứu lãm sảng theo mỗ hình RCT; thông số quan trọng để 
thể hiện một giả thuyết là tỉ số nguy cơ (risk ratio hay RR). Chẳng hạn như để 
thể hiện giả thuyết thuốc có hiệu quả giảm nguy cơ tử vong, nhà nghiên cứu có 
thể phát biểu giả thuyết hãng cách viết RR < 1. Dao đó, khi nói đến thông tin tiển 
định trang phân tích Bayes là nói đến thông tin về RR. Chẳng hạn như đối với 
hiệu quả của ramipril, ý kiến đơn giản nhất là không ai biết được ramipril tăng 
hay giảm nguy cơ tử vung, nhưng không ai tin rằng ramipril có thể hay giảm 
nguy cữ tử vong trên 50% hay tăng nguy cơ tử vũng trên 509. Nói cách khác, 
theo ý kiến này thì RR có thể dao động từ 0.5, 0.6, 0.3,..., 1.5, và xác suất cho các 
RR đó bằng nhau. Ở đây, có 11 giá trị khả đĩ cho RR, do đó xác suất mỗi RR là 
1/11 =0.09. Theo thuật ngữ thống kê, đảy là unifarm prior distribution. Có thể 
thể hiện luỗng ý kiến nảy hằng hảng sau đây: 


Tuy nhiên, trung thực tế, để tiện cho việc phản tích, các thông tin tiền định 
thường được mỏ tả băng các luật phần phỗi xác suất. Luật phản phối phổ biển 
nhất trong các nghiên cứu mỗ hình RCT là luật phân phối chuẩn (normal 
distribution). Ngoài ra, thay vì mỏ tả phản phối RR, người ta thường mỗ tả hằng 
đơn vị logarithm của RR. Nếu giả thuyết RR = 1 thi tương đương với cách phát 
biểu logRR = ũ. Ý kiến (hay thông tin tiển định) đếu có thể mô tả qua luật phân 
phối xác suất với đơn vị laogRR: 


Luống † kiến “trung dung” (uninformative prior). Theo luỗng ý kiển này, 
ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay RR = 1. (Vì nếu 
hiết rằng ramipril có hiệu quả thi không có lí da gì để làm nghiên cứu!) Tuy 
nhiên, luỗng ý kiến nảy không biết RR dao động trang khoảng nào, có thể từ 
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ũ.01 đến 100. Cá thể sử dụng luật phản phối chuẩn để thể hiện ý kiến này. Nên 
nhử răng phần phối chuẩn cỏ 2 thông số: trung hình và độ lệch chuẩn. Tạm kí 
hiệu số trung hình là Hy và độ lệch chuẩn là SN, Sau vải tỉnh toán đưn giản, 
cỏ thể thấy rằng luật phân phối chuẩn (của logRR) để thể hiện # kiến trung 
dung trên lả: 


HH, = Ú và R ve LU 


Luống ý kiến hoài nghỉ thấn (mild skepticism). Theo luống ÿ kiến nảy, 
ramipril có thể không có hiệu quả miảm nguy cơ tử vong, hay RR = 1, nhưng xác 
suất mà RRÑ dao động trong khoảng (1.95 và 1.05 là khoảng 10%. Nói theo ngôn 
ngữ xác suất, ý kiến nảy là Pr(.95 < RR < 1.05) = ũ.10, hay, theo đơn vị lagRR: 
Pr{-0.05 < lagRR < .05) = 0.10. Với ý kiến này, có thể thấy răng luật phẫn phối 
chuẩn (của lagRR) để thể hiện ý kiến hoải nghi trên lä: 


mà. =1 và 5.  = 0.40 


Luống ý kiến hoài nghi trung bình (maderate skepticism). Theo luỗng 
ý kiến này, ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay 
lagRR = m_ „„ = 0. Nhưng xác suất mà RR dao động trong khoảng 0.95 và 1.05 
là khoảng 50. Nói theo ngôn ngữ xác suất, ý kiến nảy là Pr(-0.05 < logRR 
< ñ.ũñ5) = ñ.50. Với ý kiến nảy, chúng ta có thể thể hiện hàng một phản phối 
chuẩn, với 2 thông số: 


TH =ũ KH =.0z 


Luống ý kiến hoải nghỉ cao độ (hígh skepticism]}. Theo luỗng ý kiến nảy, 
ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay logRR = m „„ = Í. 
Nhưng xác suất mà RR dao động trong khoảng 0.95 và 1.05 là khoảng ĐữM. Nói 
theo ngôn ngữ xác suất, ý kiến nảy là Pr(-.05 < logRR < 0.05) = 0.90. Với ý kiến 
này, chúng ta có thể thể hiện bằng một phản phối chuẩn, với 2 thông số: 


Nói tóm lại, có thể có 4 luỗng ý kiến (trước khi một công trình nghiên cứu 
thực hiện). Bốn luỗng ý kiến đó có thể mô tả qua luật phản phối chuẩn, với 2 
thông số trung bình và độ lệch chuẩn. Có thể tảm lược 4 luỗng ý kiến như là 4 
thông tin tiến định như sau: 
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Bảng 1. Lượng hóa nguồn ý kiến (prior information) 


Trung hình Hộ lệch chuẩn 
của lopgRR (m i ] của lupgRR (s =) 
Trung dung ũ lũ 
Hoài nghỉ thấp ũ ũ.40 
Hoài nghỉ trung bình ũ ũ.0z 
Houäi nghỉ can độ ũ 0.03 


2.3. Xác định Pr(E | H) hay khả dĩ (Iikelihuad]) 

Như để cập trên, những gì nghiên cứu thu thập được có thể xem là bằng 
chứng E. Trong trưởng hợp nghiên cửu HOPE, E chỉnh là RR [giảm | tử vong liên 
quan đến ramipril. Số liệu cũng bổ cho thấy RR = Ú.84, với khoảng tín cậy 95% 
dao động trong khoảng .75 đến 0.85, Nhưng RR cẩn phải được hoán chuyển 
sang đơn vị logRR để dễ phân tích và tính toán. Từ số liệu trên, có thể thể hiện 
thông số trên qua luật phản phối chuẩn với trung bình là: 

m,.. = log(0.84) = -0.174 
và độ lệch chuẩn có thể ước tính từ khoảng tin cậy 951% như sau: 


„ _ eg(095)- log(0:75) — san 
_= 2x1.96 


2.3. Xác định Pr{H | E] 

Sau khi đã có những thông số về thông tin tiền định và bằng chứng, có thể 
xác định khả năng của một giả thuyết bằng công thức: 

[Xác suất hậu định | = [Xác suất tiền định | x [Bằng chứng] 

Nhưng vỉ xác suất tiến định và bằng chứng đểu được thể hiện hàng luật nhẫn 
phối chuẩn, cho nên xác suất hậu định cũng có thể xác định từ đó. Thật ra, chỉ 
cần vải tỉnh toán, có thể xác định xác suất hậu định như sau: 

Nm 

Trong đó N là viết tắt từ luật phân phối chuẩn, m „2y Và 5. ạ„¿„„ là 2 thông số 
của lagRR hậu định. Sau vài thao tác đại số, đễ dàng thấy chỉ số trung bình và độ 
lệch chuẩn của thông số ÍngRR hậu định là: 


prealerinr  aks Nữm „ư›  nr) . Nữm,„„ Suz,) 
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Hữ LAN 
7 + 7 1= ị 
” —_— EU _ TửM và ponurier 


1 + 3 gˆ = 
'Ã ning 'Ã “ng l ##imr LỮuik£ 


Thay thế m_ = -Ú.174, s,= Ú.06, và thông số tiến định H vụ = Ú và s„= 1Ù, 


chúng ta cỏ: 


FỂ nagueriar - 


... 
(i0 0.06° 


Vì xác suất hậu định tuãn theo luật phần phối chuẩn, cho nên 2 thông số trên 
củ nghĩa là hàm phản phối chuẩn của xác suất hậu định là: 
_(x+0174). +. 174} 


FT xa 


Trang đó, x là số logRR khả dĩ Hàm f[x} cung cấp một số ước tỉnh rất có 
¡ch. Chẳng hạn như chủng ta có thể đặt câu hỏi: xác suất mà ramipril giảm nguy 
cơ tử vong trên 109%ú là bao nhiêu? Giảm nguy cơ tử vong trên 1 có nghĩa là 
RR < 0.90 hay logRR < -0.105. Dao đó, đáp số cho cầu trả lời là: 


Pr(log R8 < ~0.105) = [ `” ƒ(x) 

Tuy công thức có vẻ nhức tạp, nhưng thật ra, tất cả những tỉnh toán có thể 
thực hiện băng phần mềm Excel hay R một cách rất dễ dàng. Đáp số cho tích 
phân trên là 0.874. Nói cách khác, khả năng mà ramipril giảm nguy cơ tử vang 
trên 109 là 87.4. 

Nhưng xác suất hậu định tùy thuộc vào xác suất tiền định. Da đỏ, chúng ta 
cũng có thể tính xác suất hậu định cho mỗi luỗống ý kiến trong phần trên như 
Bảng 2 sau đây. 
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Bảng 2. Thông số tiến định, bằng chứng, và thông số hậu định 


m=...a cố... .Ẻ6..... 
Mứcộ uy  bậngchúng  hônđịnh — ramipilgiim 
ˆ ®ổ nhac. . cnnỶẽn0 ốc 7C 
distributinn} trên 1ũ% 
Trungdung  N(UI00) (0174006)  N(-0.174, (874 
0.08) 
Huải nghỉ N(HL040) N(0174.006}  N(L-ũ170, (1.862 
thấp 0.059) 
Hoải nghĩ N(L0071  N(0174.006}  N(-0100, (454 
trung bình 0.046) 
Hoải nghĩ N(L003)  N(0174006}  N(-0035, (1.004 
can độ ũ.027) 
Ghi chủ: Nịa, h} cỏ nghĩa là nhân phối theo luật phân phối chuẩn [Narmal] 
với trung binh ø và độ lệch chuẩn b. 


Kết quả phần tích trên cho thấy nếu chúng ta khởi đầu bằng một ý kiến trung 
dung, sau khi xem qua bảng chứng thực tế, chúng ta có thể kết luận răng khả 
năng ramipril giảm nguy cơ tử vong tối thiểu 109 là 87.4%. Nhưng với sự hoải 
nghi thấp, khả năng này giảm chút ít xuống củn 86.2%. Với hoài nghĩ cao độ, khả 
năng mả ramipril giảm nguy cơ tử vong tối thiểu 10% chỉ 0.4%. Nói cách khác, 
những phản tích trên đây cho thấy xác suất hậu định rất tùy thuộc vào ý kiến 
hay thông tin tiển định. Do đó, vấn để xác định thông tin tiền định cực kì quan 
trọng. Trong thực tế, thông tin tiến định thưởng được đúc kết cẩn thận từ y văn 
hay các nghiên cứu trang quả khử. Những kết quả phần tích tổng hợp (meta- 
analysis) là những thông tín rất có ích để xác định thông tin tiến định. 

Phân phối về thông tin tiến định (prior distribution), bằng chứng (current 
likelthood) và kết quả hậu định (posterior distribuHon) có thể mình họa qua 3 
hiểu đã dưới đây (chủ ý, trong mỗi biểu đổ, “mean” là giá trị logRR). 
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Biếu đổ T. Biểu đồ phản ảnh thông tin tiền định (Ä], 
bằng chứng nghiên cửu |B] và thông tin hậu định [C]. 


Một trang những điểm mạnh của phương pháp Bayes là có thể ước tính 
khả năng cho bất cứ ngưỡng hiệu quả lãm sàng nào. Trong phản tích vỉ dụ trên, 
chúng ta xem giảm nguy cữ tử vong trên 1ũ% là ngưỡng có ý nghĩa lãm sảng, 
nhưng chúng ta cũng có thể tỉnh khả năng cho các ngưỡng khác như giảm 5%, 
1M, 15%, 20%, v.v... Bảng sau đây trình bảy khả năng về hiệu quả của ramipril 
đối với các ngưỡng lắm sảng vừa kể (dựa vào thông tín tiến định “trung dung”). 

Bảng 3. Khả năng ramipril giảm nguy cơ tử vong trên 5%, IỮ%, và 20% 


Ngưỡng lâm sàng Khả năng 


Ciảm > 58h .g79 
Cziảm z 1ũ8n ũ.874 
Giảm > 15% | 0.57B 
Ciảm > 20” ũ.20a 
Cziảm > 258" ũ.030 
Ciảm > 308" 0.001 


Kết quả trên đây cho thấy khả năng ramipril quả thật giảm nguy cơ tử vung 
trên 5 là khá “chắc chắn”, nhưng khả năng ramipril giảm nguy cơ tử vung trên 
2n thì rất thấp (chỉ 3). 

3. Diễn giải kết quả nghiên cứu lâm sàng 

Để diễn giải kết quả nghiên cứu, cần phải nhẫn hiệt mữa khác hiệt có ý nghĩa 
thống kê (statistical signiiicance) và ý nghĩa lâm sảng (clinical signilicance). Một 
khác hiệt nhỏ có thể có ý nghĩa thống kế (do số cỡ mẫu quả lớn) nhưng hoàn 
toàn không có ý nghĩa lâm sảng. Ngược lại, một khác biệt có thể không có ý 
nghĩa thống kẻ (do cũ mẫu nhỏ hay các khiếm khuyết về nghiên cửu), nhưng có 
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Ý nghĩa lãm sảng. Dao đá, trước khi đánh giá hiệu quả một thuật điểu trị hay can 
thiện, cẩn phải xác định mức độ ảnh hưởng có thể xem là có # nghĩa lãm sảng. 


Định nghĩa thế nào là có ý nghĩa lãm sảng là vấn để khó khăn. Miột phẩn của 
sự khỏ khăn là dao thiểu những tiêu chuẩn cụ thể, và một phần khác là do tùy 
thuộc vào hối cảnh của vấn để. Trong lĩnh vực tìm mạch, phần lớn những công 
trinh nghiên cửu lãm sàng đếu được thiết kế để nhằm phát hiện một khác biệt về 
nguy cơ tử vong tử 20% đến 30%, dù một số chuyên gia cho răng nếu một thuốc 
củ thể giảm nguy cử tử vong 104 hay thậm chỉ 5% vẫn có thể xem là có ý nghĩa 
lãm sảng. Đối với một chỉ tiêu lãm sảng như tử vong, thiết tưởng một biện pháp 
can thiệp má giảm được 1Ũ% nguy cơ tử vong có thể xem là có ý nghĩa lãm sảng. 


Chúng ta xem 2 lung ý kiến: trung dung và hoải nghĩ trung bình làm hai 
quan điểm về hiệu quả của điểu trị. Chúng ta ước tỉnh xác suất mà thuốc (hay 
hiện pháp can thiệp) giảm nguy cơ tử vong trên 10%. Gọi xác suất này cho luỗng 
ý kiến trung dung là P, „„„; và cho luồng ý kiến hoài nghỉ trung bình là P.„ „uụ. 
Theo một để nghị mới đây, nếu một phát hiện với P.,uạ > 0.95 và D„ uuạ > 0.95 thì 
có thể xem đó là bằng chứng rất thuyết phục, không còn nghỉ ngờ, nếu PP, „uạ < 
(.95 và Pa > 0.95 thì có thể xem đỏ là bằng chứng thuyết phục. Chỉ tiết phân 


hạng bằng chứng có thể xem dưới đây. 


Hạng |  Xácuấi 
nen |as>0957,,,>095—- |Khôngcdaaging 
- Ga ng 
: Đang ni ng 
: TT 

Tham khảo: [D3iamond GA, et al. Eayesian Classilcatian of Chnical PracHce 
Gulidelines. Arch Iniern Mied 23008; 169: 1436-1437. 

Dựa vào nguyên lí trên, bảng sau đảy tôm tắt kết quả chỉnh của một số công 
trinh nghiên cứu nổi tiếng trong lĩnh vực tim mạch [12-231 |. Mỗi nghiên cứu 
đểu có mục đích kiểm định giả thuyết can thiệp giảm nguy cơ tử vang. Tất cả các 
nghiên cứu nảy đếu có "ý nghĩa thống kể” hiểu theo nghĩa trị số P thấp hơn (0.05, 
và khoảng tin cậy 95% không bao hàm 1. Tuy nhiên, khi nhẫn tích và diễn giải 
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theo trường phái Bayes (với tiêu chỉ giảm nguy cơ tử vong trên 10%) thi kết quả 
của tất cả các nghiên cứu nảy chỉ có thể xếp vào nhóm “có bằng chứng” Không 
một kết quả nào được xem là “băng chứng thuyết phục” 


Bảng 5: Thang xếp hạng bằng chứng của một số nghiên cứu nổi tiếng 


PURSUIT[13| — 031(082-100) 


0.88 (0.82 — 0.34) 
GUSTO [I5] 0.86 (0.78 _ 0.34) 
LIFE [16] 0.86 (0.77 — (96) 
HOPE [12] 079 (0.72-— 0.87) 
BHAT [17] 0.74 (0.58 _ 0.91) 
0.72 (0.60 — 0.86) 
MADIT-I[I9]  072(0.56-0393) 
ASCOT-LLA [230] 0.65 (0.51 - 0.83) 
LyonDietHeart 0.32(017-052) 00003 1.000 
[31] 


Bảng trên đảy còn cho thấy phần tích Bayes cung cấp thông tin ngoài kết quả 
của khoảng tin cậy 95%. Chẳng hạn như nghiên cứu 45 và MADTT-II có cùng 
RR (0.72) và tương đương khoảng tin cậy 95%, nhưng xác suất 45 giảm nguy 
cơ tử vong trên 10% (với luỗng ý kiến hoải nghi) cho 45 là 61%, cao hơn so với 
MADTT-TI (khoảng 32M). 

Nói tóm lại, phương pháp phân tích và suy luận theo trưởng phải Bayes khác 
với trưởng phải tấn số ở phát biểu về một kết quả nghiễn cứu. Đối với trường 
phái tấn số (hay thống kẻ cổ điển), một kết quả nghiên cứu cỏ thể “có ý nghĩa 
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thống kế” hay “không có ý nghĩa thống kế” dựa vào một ngưỡng của trị số P (như 
P< 0.05 hay P < 0.01), nhưng không cho chúng ta biết khả năng của giả thuyết. 
Trường phải Bayes cung cấp cho chúng ta một “đáp án” trực tiến liên quan đến giả 
thuyết khoa học hay mức độ ảnh hưởng của một thuật can thiện. Đối với trường 
phái thống kẽ cổ điển, mỗi kết quả nghiên cứu được diễn giải một cách đơn lẻ, 
không cẩn xem xét đến các kết quả khác hay kết quả của nghiên cửu trước. Tuy 
nhiên, đổi với trưởng phải Bayes, kết quả nghiên cứu phải được xem xét cùng với 
các kết quả nghiền cửu trước hoặc kiến thức hiện hành. Hiện nay, phản tích và 
suy luận theo trưởng phải Bayes cảng ngày càng phổ biến trong các nghiên cứu 
lãm sảng. Nhiễu công trình nghiên cứu lầm sàng đổi chứng ngẫu nhiên được 
thiết kể theo mỗ hình Bayes. Một số tập san y khoa quốc tế cũng khuyến khích 
các nhà nghiên cửu và tắc giả nên sử dụng phản tích Bayes trong việc diễn giải 
kết quả nghiên cứu. Các chuyên gia tiên đoán răng trường phải phản tích Bayes 
sẽ trở thành một nhương pháp nghiền cửu chuẩn trong thể kỉ 21. 


Tuy nhiên, phương phản Bayes cũng có những hạn chế làm cho việc ửng 
dụng trường phái Bayes hơi khó khăn. Chẳng hạn như đổi với phương pháp 
phân tích Bayes, việc quan trọng nhất là nhải cung cấp các thông tín tiến định, 
và thông tin nảy có ảnh hưởng đến việc suy luận về kết quả hậu định. Vấn để đặt 
ra là thông tin tiển định đến từ đâu và tỉnh khách quan của thông tin này. Tuy 
nhiên, trong thời kì có nhiều nghiên cứu và nguồn thông tin như hiện nay, các 
phân tích tổng hợp (meta-analysis) thưởng là những nguồn thông tin tiền định 
qui báu. Nếu không có thông tin tiến định, chúng ta vẫn có thể sử dụng các luật 
phân phối thống kê (như mô tả trong phần 2 của hải viết nảy), chẳng hạn như 
phản phối theo luỗng ý kiển trung dung, và trong trưởng hựp nảy thi kết quả 
phân tích của Bayes không khác với kết quả phản tích của trường phái cổ điển. 
Tuy nhiên, một lợi thế của trường phải Bayes là có thể ước tính khả năng của 
hất cứ một ảnh hưởng lãm sảng nảo và tức số này có ý nghĩa lớn cho các quyết 
định lãm sảng. 


Ngày nay, y khoa đặt nặng vào các chỉ tiêu lâm sàng (clinical outcome] và 
hưởng dẫn (hay phác đỗ} điểu trị. Định hưởng nảy chịu sự ảnh hưởng lớn của 
phương pháp suy luận xác suất trong quyết định lắm sảng. Một quyết định lắm 
sàng sảng suốt nhải dựa vào bằng chứng khoa học, phải cần đổi giữa đữ liệu 
nghiền cứu, các giá trị đạo đức cá nhân, và phương pháp Bayes một cách tiếp cận 
lí tưửng đắp ứng các yêu cầu đỏ. 
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KIẾM ĐINH THỐNG KÊ 
VÀ KIỂM ĐINH GIẢ THUYẾT 


và nghiên cứu khoa học. Cũng chỉnh vì sự phổ hiến mả nó cũng đễ hị 

hiểu lắm và lạm dụng. Một nghiên cửu ở một nhóm bác sĩ chuyên khoa 
và có kinh nghiệm trong nghiên cứu y học cho thấy có đến 85% không hiểu ý 
nghĩa của trị số P [1]. Đại đa số những người được hỏi hiểu rằng một kết luận 
(về sự khác biệt) với trị số P = Ú.05 có nghĩa là khả năng mả kết luận đỏ sai là 
59, hay khả năng má kết luận đỏ đúng là 95% (lấy I trừ cho 0.05). Nhiễu người 
khác thi hiểu rằng một sự khác hiệt với trị số P càng nhỏ thì mức độ ảnh hưởng 
cảng cỏ ý nghĩa và độ tin cậy của kết luận cảng cao. Nhưng rất tiếc răng cả hai 
cách hiểu nảy đểu sai. Điểu đáng ngạc nhiên là không những giới làm nghiên 
cứu khoa học hiểu sai, mà ngay cả các nhà nghiên cứu có kiến thức thống kẽ khá 
như dịch tễ học cũng hiểu sai. Thật ra, một số nhà thống kẻ chuyên nghiện cũng 
hiểu sai ý nghĩa của trị số P bởi vì một số sách giáo khoa giải thích hoặc là sai, 
hoặc không rõ rằng! 


Vậy thì ý nghĩa thật của trị số P là gi? Để trả lời câu hỏi nảy, chúng ta phải 
điểm qua triết lí khoa học, vá triết lí phản nghiệm (falsicatonism). Theo Karl 
Popper [2], cha đẻ của triết lí nhản nghiệm, một giả thuyết được xem là mang 
tính “khua học” nếu giả thuyết đó có khả nắng “phản nghiệm” (falsiied). Đặc 
điểm duy nhất để có thể phân hiệt miữa một lí thuyết khoa học thực thụ với ngụy 


T rị số P (P value) có lễ là một chỉ số phổ biến nhất trong phản tích dữ liệu 
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khoa học (pseudoscience) là thuyết lhhoa học luôn có đặc tỉnh có thể “bị bác bỏ” 
hay “khả năng phản nghiệm” bằng những thực nghiệm đơn giản. Ông gọi đó là 
“khả năng phản nghiệm” (falsihahility} [3|. Phép phản nghiệm là nhương cách 
tiến hãnh những thực nghiệm không phải để xác mình mà để phê phản các lí 
thuyết khoa học, và có thể coi đây như là một nền tảng cho khoa học thực thụ. 
Chẳng hạn như giả thuyết [đơn giản] “vi khuẩn V: chalerae gầy bệnh dịch tả” có 
thể bác bỏ nếu có một bệnh nhân dịch tả không nhiễm vị khuẩn V chalerae. 

Đứng trên phương diện khoa học, có hai mỗ hình thực tế để tiến cận lí thuyết 
phản nghiệm: đỏ là mỗ hình kiểm định thống kế và mỗ hình kiểm định giả 
thuyết. Rất nhiều sách giáo khoa thông kẻ và khoa học đã được viết ra, nhưng rất 
tiếc, nhiễu tác giả không piải thích hay không nhẫn biệt được hai mỗ hình này. 
Có tác giả thậm chỉ củn nhấm lẫn khi diễn dịch, và đỏ cũng chỉnh là một trong 
những nguyễn nhän dẫn đến tỉnh trạng hiểu lắm ý nghĩa của trị số E Trong phần 
này, tôi sẽ mải thích ngắn gọn và cung cấp tải liệu tham khảo của hai mỗ hình để 
hạn đọc cỏ thể hiểu qua và nghiên cứu thêm. 


1. Mô hình kiểm định ý nghĩa thống kê (test of significance} 


Triết lí phản nghiệm rất phổ biến và trở thành một mỏ hình để giải thích 
sự tiến bộ của khoa học. Chịu ảnh hưởng bởi triết lí này, Ronald A. Fisher 
(1890 - 1962), một nhà di truyền học người Ảnh và cũng là "cha để” của nến 
thống kẻ học hiện đại, để xuất một phương pháp định lượng để phản nghiệm 
một giả thuyết khoa hạc. Ông gợi phương pháp này là “Test of Signilcance” 
[4-5] (tôi tạm dịch là: phương phán kiểm định ý nghĩa thống kê). Fisher quan 
niệm rằng thống lẻ là một hộ phận quan trọng của phương pháp suy luận theo 
phép qui nạp (inductive inference), tức là phương pháp suy luận dựa vào quan 
sắt tử các mẫu (sample) và khải quát cho một quấn thể (population). Phương 
pháp kiểm định ý nghĩa thống kê được tiến hành theo 3 hước như sau: 


« Bước Ì, phát biểu một giả thuyết vũ hiệu (nuÌÌ hypnthesis). Giả thuyết vũ 
hiệu là miả thuyết ngược lại với giả thuyết mà nhà nghiên cửu muốn kiểm 
định. Chẳng hạn nhỉ nếu giả thuyết điểu trị bằng thuốc ramipril làm giảm 
nguy cơ tử vong, thì giả thuyết vô hiệu sẽ phát biểu là “tỉ lệ tử vang ở hệnh 
nhân được điểu trị bằng ramipril băng với nhỏm giả dược. Gọi giả thuyết 
vỗ hiệu là Hữ. 


«Bước 2, thu thận dữ liệu liên quan đến giả thuyết. Trong ví dụ trên, số liệu 
sẽ là số trưởng hợp tử vong. Gọi dữ liệu là D. 
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s Bước 3, tức tính xác suất quan sát dữ liệu ? nếu giả thuyết Hũ đúng. Nói 
cách khác và viết theo ngôn ngữ toán, bước này ước tính P{D | Hũ). Đây 
chỉnh là trị số F (P-value). 


Eisher để nghị báo cáo trị số P một cách chính xác. Tức là không có những 
cách viết như P < 0.05 hay P > 0.01 má phải là P = 0.043 hay P = 0.002. Fisher 
củn để nghị răng nếu trị số P thấn hưn 05 thi giả thuyết Húũ (võ hiệu) không 
phủ hợp với số liệu quan sát được. Đổi với Eisher, không có chuyện “bác hỏ giả 
thuyết” hay “chứng minh giả thuyết” mả chỉ có số liệu có phù hợp, có nhất quản 
với giả thuyết hay không mà thôi. Quan điểm này chịu ảnh hưởng “đậm” của 
triết li phản nghiệm của Popper, vì theo triết lí này, chủng ta không thể chứng 
minh bất cử một giả thuyết nào, mà chỉ có thể bác bỏ (disprove}) một giả thuyết 
bằng dữ liệu quan sát được. 

Cũng có thể xem trị số P như là một chỉ số ngạc nhiên. Ngày 27/4/2013, báo 
soh„.vn dưới tựa để “Choáng với chiểu cao cực khủng của nam sinh lớp 12” then 
đó, một em học sinh lớp 12 có chiểu cao 204 cm. Cầu hỏi đặt ra là chiếu cao nảy 
củ đáng ngạc nhiên? Ngạc nhiên hay không củn tủy thuộc vào phân bố chiểu can 
của thanh niên Việt Nam. Theo nghiên cửu của chúng tỏi, chiếu cao của nam 
thanh niên Việt Nam trung binh là 170 cm và độ lệch chuẩn là 6.3 cm. Có thể thể 
hiện phản bố của quấn thể như sau. 
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Chiểu cao của em học sinh là 204 cm, tức năm nguài giá trị kì vọng của quân 
thể thanh niên Việt Nam. Thật ra, chủng ta cỏ thể tỉnh xác suất một em học sinh 
với chiều cao 204 cm trong quân thể có trung bình là 170 cm và độ lệch chuẩn 
6.3 cm: 


Ï - pnarm(204, mean=17, sđ=6.3) 


với kết quả là 0.0000000339. Có thể xem đó là trị số B, một thước đo về sự ngạc 
nhiên. 


2. Mà hình kiểm định giả thuyết (test of hypothesis) 


Jerzy Neyman (1894 - 1981) là một nhả toán học xuất sắc mốc Ba Lan và Egan 
Pearson (1895 - 1980} là một nhà thống kẽ học (con của giáo sư Karl Pearson, 
cha đẻ của lí thuyết Chi-square và hệ số tương quan) cùng lúc với Fisher, phát 
triển một phương pháp rất khác với Fisher, mà hai ông gọi là Test of Hypothesis 
(kiểm định giả thuyết] [6]. Neyman và Pearson bác bỏ khái niệm suy luận theo 
qui nạp; hai ông nghĩ rằng thống kẽ học là một nhương pháp hay cơ chế để 
hướng dẫn chúng ta đi đến một quyết định đúng về lầu về dải. Nói cách khác, 
Neyman và Pearson chủ rằng phương pháp của Fisher vô nghĩa! 

Một cách đơn giản, mỗ hình kiểm định giả thuyết của Neyman và Pearson có 
thể thực hiện qua các bước như sau: 


« Bước l, phát biểu giả thuyết chính (H1) vả giả thuyết vỏ hiệu (HÚ). 

« Hước 3, xác định mức độ a và b có thể chấp nhận được và tiớc tỉnh cũ 
mẫu cẩn thiết. Theo đó, ä là xác suất bác bỏ giả thuyết H1 nhưng đỏ là giả 
thuyết đúng, và b là xác suất bác bỏ Hũ trang khi Hũ đúng. 

« Bước 3, thu thập dữ liệu liền quan đến giả thuyết. 


s_ Bước 4, nếu dữ liệu năm trong khoảng bác bỏ giả thuyết Hũ, thi chấp nhận 
giả thuyết H1; nếu không thi chấp nhận giả thuyết Hũ. Chú ý rằng "chấp 
nhận” một giả thuyết không có nghĩa là chúng ta tín vào giả thuyết đỏ, mà 
chỉ củ nghĩa là chúng ta hành động với điểu kiện đó là giả thuyết đúng. 


Nguyên lỉ của mỏ hình Neyman và Pearson là chúng ta dựa vào đữ liệu để 
chụn một giả thuyết sao cho về lắu về dài chúng ta không quá sai. Chính vì thể 
mả ngày nay chúng ta thưởng chọn ä = 5% và b = 10 đến 20%. 
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Eisher bác bỏ hoàn toàn mỗ hình suy luận của Neyman và Pearson [7]. Ủng 
cho rằng đó là một mô hình... vỗ duyên. Eisher nhạo báng rằng các nhà toán 
học (ám chỉ Neyman và Pearson) “chẳng hiểu gì về thực nghiệm và để ra một 
mỗ hình quả phi thực tế Trong những năm sau đỏ (thập niên 1930) cộng đẳng 
thống kê hạc chứng kiến một cuộc tranh luận dai dẳng và đôi khi nóng bỏng 
giữa Fisher và Neyman - Pearson trên các tập san thống kẻ học ở Anh. Fisher 
tuy là một người thông minh tuyệt với, một nhà tư tưởng với những suy nghĩ 
trữu tượng, nhưng lại là một người rất khỏ tính và cỏ khi hẹp hỏi. Sự hẹp hỏi của 
Eisher thể hiện ở chỗ ông sử dụng chức quyển khoa bảng của minh để gãy khá 
khăn cho Neyman đến nỗi ông này chịu không nổi phải di cư sang Mĩ và sau này 
trở thành giáo sư tại trưởng Đại học Berlceeley. Sau này, Neyman được lịch sử ghi 
nhận là một nhà thống kê học xuất sắc cỏ công cực kỉ to lớn cho khoa học hiện 
đại, sánh vai cùng các “đại thụ” trong khoa học hiện đại. Nước Mĩ quả thật là mỗi 
trưởng cho ông thi thổ tải năng! 


3. Mật mỗ hình hỗn hựp 


Trở trêu thay, mấy mươi năm sau, hai mồ hình của Fisher và Neyman-Pearson 
được “hun đúc” thành một mỏ hình tổng hợp mả chúng ta ứng dụng ngày nay 
trong nghiên cứu y học. Mô hình này sử dụng kết quả kiểm định thống kê của 
Elsher để đi đến quyết định chấp nhận hay hác hỏ giả thuyết vỏ hiệu Hũ hay 
giả thuyết chính H1 theo mỏ hình của Neyman và Pearson. Tiêu biểu cho mỗ 
hình nảy là nghiên cứu lắm sảng đối chứng ngẫu nhiễn (randomized cantrolled 
clinical trial hay RCT). Theo đó, một nghiên cứu lãm sảng được tiến hành then 
các bước như sau: 

s Bước l, định nghĩa một giả thuyết vỗ hiệu và một giả thuyết chỉnh. Thỉ 
dụ trong một nghiên cứu lắm sảng, gắm hai nhóm bệnh nhân: một nhắm 
được điểu trị bằng thuốc À, và một nhóm được điểu trị bằng nlaceho, nhà 
nghiên cứu có thể nhát hiểu giả thuyết vô hiệu răng độ hiệu nghiệm thuốc 
A tương đương với pÌaceho. 

s Bước 2, xác định xác suất a (còn gọi là sai số loại I) và Ê (còn gọi là sai số 
loại I1), và ức tỉnh cử mẫu dựa vào hai xác suất nảy. 

s Bước 3, thu thận dữ liệu liên quan đến giả thuyết. Gọi đữ liệu là D. 


s Hước 4, sử dụng phương pháp kiểm định ý nghĩa thống kẽ của Fisher tiếc 
tỉnh xác suất E(D | Hũ). Gọi trị số này là P. 
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s Bước 5, nếu P < 0.05, bác bỏ giả thuyết Hũ. Chủ ý, bác bả Hũ không có 
nghĩa là chúng ta chấp nhận giả thuyết HI. 


Ví dụ 1. Có thể minh họa chủ các bước trên bằng một vỉ dụ về nghiên cửu 
hiệu quả của thuốc ramipril trong việc phòng chống tử vong và đột qui [1]. Với 
giả thuyết rằng thuốc cỏ hiệu nghiệm giảm nguy cơ tử vong và đột quị, các nhà 
nghiền cứu so sánh tỉ lệ tử vong và đột qui giữa hai nhỏm hệnh nhần: nhằm Ì 
được điểu trị bằng ramipril và nhỏm 2 là nhằm giả được (placeho). Bát đầu bằng 
cách xác định a = 0.05 và ỗ = ñ.8Ũ, các nhà nghiên cứu tức tỉnh số lượng bệnh 
nhãn cẩn thiết. Sau ba năm thu thập số liệu, kết quả có thể tóm lược trong bảng 
số liệu sau đây. 

Bảng 1. Hiệu quả của ramipril giảm nguy cơ nhối mắu cơ tỉm, 
đột qui, tử vong và tiểu đường thể hiện qua tỉ số nguy cơ và trị số P 


Tỉ số cữ (relative ri 
Xoă-b cm... 
và khoảng tin cậy 95% : 
Nhỗõi máu cơ tim, đột quị, tử vong 0.83 (0.75 - 0.91) (I.0M2 
Tỉ lệ mới mắc bệnh tiểu đường ũ.ã9 (0.56 - ñ.85] ñ.0016 


HOPE/HOPE-TDOO Study Investigators. Long-term cffects of Ramipril 
an cardiovascular events and diahetes. Results of the HÖOBPE Study Extension. 
Circulation 2005; 112:13398-134ã. 


Bởi vi trị số P thấp hơn mức a (0.05) mà các nhà nghiên cửu để ra từ lúc đẩu 
(trước khi thu thập số liệu); cho nên, các nhà nghiên cứu kết luận răng sự khác 
biệt về tỉ lệ tử vong và đột quị giữa hai nhóm có ý nghĩa thống kê. Tất nhiên, (trị 
sĩ P trên không có nghĩa là nghiền cửu ẳã chững ruĩnh rằng thuốc ramipril cả hiệu 
quả giảm nguy cử tử vong và đột qui. Nó có nghĩa là nếu thật sự thuốc ramipril 
không có hiệu quả giảm nguy cơ tử vong và đột quị thì xác suất mà các nhà 
nghiên cửu quan sắt những số liệu trên là 0.0002. 


4. Vấn để của trị số P 


Có lễ nói không ngoa rằng trị số P là một cạn số phổ hiến nhất trong khoa 
học tử khoảng 100 năm qua [9]. Hầu hết các bài bảo khoa học đểu trình bảy trị 
số P như hàm #ý năng cao tính khoa học và độ tin cậy của bài bảo. Tuy nhiên, 
ngay tử lúc mới “ra đời, trị số P đã bị phê bình dữ dội. Có người cho rằng việc 
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ứng dụng trị số P trong suy luận khoa học là một bước lùi, là một sự thoái hóa 
của khoa học, nên để nghị không sử dụng trị số này trong nghiên cứu khoa học. 
Nhưng dù chịu nhiều chỉ trích và phê bình, ứng dụng phương phán kiểm định 
giả thuyết vả trị số P vẫn cảng ngày cảng phổ biến, đơn giản vì chúng ta chưa có 
một phương pháp khác tốt hơn, hay hợp lí hơn, hay đơn giản hơn. Trong phần 
này, tôi sẽ không điểm qua tất cả các phê hình trị số P (vì làm như thế cần một 
cuỗn sách), mả chỉ nêu một số vấn để chúng ta cẩn lưu ý khi diễn dịch trị số P. 

4.1. Vấn để logic 

Như qua minh họa trên, trị số P không cho chúng ta biết gi về sự khả dĩ của 
một giả thuyết, bởi vi nó là một xác suất có điểu kiện. Trị số P cho chúng ta biết 
xác suất của dữ liệu (data) nếu một giả thuyết là đúng. Cái khiểm khuyết lớn 
nhất của trị số P là nó thiếu tính logic. Thật vậy, nếu chúng ta chịu khó xem xét 
lại vi dụ trên, có thể khái quát tiến trình của một nghiên cứu y học (dựa vào trị 
số P] như sau: 

s_ Để ra một giả thuyết chính vô hiệu (H0) 

s« Từ giả thuyết võ hiệu, để ra một giả thuyết chính (H1) 

se Tiển hành thu thập dữ liệu (D} 

s Phản tích dữ kiện: tỉnh toản xác suất ID xảy ra nếu Hũ là thật. Nói theo 

ngôn ngữ toán xác suất, bước này chính là bước tỉnh toán trị số P hay 
P(D | H0). 


Vì thể, con số P có nghĩa là xác suất của dữ liệu D xảy ra nếu (nhấn mạnh: 
“nếu”) giả thuyết vỗ hiệu Hũ là đúng. Như vậy, củn số P không trực tiếp cho 
chúng ta một ý niệm gì về sự thật của giả thuyết chính HI; nỏ chỉ gián tiếp 
cung cấp bảng chứng để chúng ta chấp nhận giả thuyết chỉnh và bác bỏ giả 
thuyết võ hiệu. 

Lugic đằng sau của trị số P có thể được hiểu như là một qui trình chưng minh 
tha ngược (proof by contradicHon): 

s Mliệnh để 1: Nếu giả thuyết vỗ hiệu đúng, thi sự kiện nảy không thể xảy ra; 

s Mệnh để 3: Sự kiện xảy ra; 

«Mệnh để 3 (kết luận}: Giả thuyết võ hiệu không thể đúng. 


- Lỗ - 


hffps://tieulun.hopto.org 


Mếu cách lập luận trên khó hiểu, chúng ta thử xem một ví dụ cụ thể như sau: 


« Nếu ông Tuần bị cao huyết áp, thì öng không thể có triệu chứng rụng tóc 
(hai hiện tượng sinh học này không liên quan với nhau, ít ra là theo kiến 
thức y khoa hiện nay); 


« Ông Tuấn bị rụng tóc; 
«Do đỏ, ông Tuần không thể hị cao huyết áp. 


Trị số P, do đó, gián tiến nhản ánh xác suất của mệnh để 3. Và đó cũng chính 
là một khiếm khuyết quan trọng của trị số P, bởi vì nó ốc tính mức độ khả dÍ của 
th liệu, chứ không nói cha chủng ta biết miữc độ khả dÍ của một giả thuyết. Điều 
này làm cho việc suy luận dựa vào trị số P rất xa rửi với thực tế, xa rời với khoa 
học thực nghiệm. Trong khoa học thực nghiệm, điểu mà nhà nghiên cửu muốn 
hiết là với đữ liệu mà họ có được, xác suất của giả thuyết chính là bao nhiều, 
chứ họ không muốn biết nếu giả thuyết đảo là sự thật thi xác suất của dữ liệu là 
hao nhiêu. Nói cách khác và dùng kí hiệu mô tả trên, nhà nghiên cứu muốn biết 
P(HI | D), chứ không muốn biết P(D | H0) hay P(D | H1). 


4.2. Vấn để kiểm định nhiều giả thuyết 


Như đã nỏi trên, nghiên cứu y học là một qui trình kiểm định giả thuyết. 
Trong một nghiên cứu, ít khi nào chúng ta kiểm định chỉ một giả thuyết duy 
nhất, mà rất nhiều giả thuyết cùng một lúc. Chẳng hạn như trong một nghiên 
cứu về hiệu quả của ramipril, các nhà nghiên cứu có thể phân tích hiệu quả của 
ramipril qua nhiễu tiêu chỉ lắm sàng như nguy cơ tử vong, nhối mắu cơ tim, đột 
qui, tỉ lệ mắc hệnh tiểu đưởng, v.v... từng giới tính, từng nhóm tuổi, hay phân 
tích theo các đặc tính lâm sảng của bệnh nhãn. Mỗi một phân tích như thế có thể 
xem là một kiểm định giả thuyết. Ở đây, chúng ta phải đổi điện với vấn để nhiều 
giả thuyết (multinle tests oŸ hypothesis hay còn gọi là multinle camparisons). 


Văn để là như sau: nếu chúng ta kiểm định một giả thuyết chủng ta chấp 
nhận một sai sót 54 (giả dụ chúng ta chấn nhận tiêu chuẩn P = 0.05 để tuyên bố 
củ ý nghĩa hay không cỏ ý nghĩa thống kẻ). Nói cách khác, sự thật là khẳng thuốc 
có hiệu quả sai, những kết quả kiểm định thống kê cho ra kết quả có ý nghĩa 
thống kẽ, và chúng ta chấp nhận rằng sự kiện này có thể xảy ra với tấn số 5ú. 
Vấn để đặt ra trong hỗi cảnh kiểm định nhiều giả thuyết như sau: nếu trong số 
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n thử nghiệm, chúng ta tuyên bố k thử nghiệm “có ý nghĩa thống kê” (tức là P 
< 0.05), thì xác suất có ít nhất một giả thuyết sai là bao nhiều? 


Bể trả lời câu hỏi này chúng ta sẽ bắt đầu bằng một vỉ dụ đơn giản. Mỗi kiểm 
định chúng ta chấp nhận một xác suất sai lầm là 0.05. Nói cách khác, chúng ta có 
xác suất đúng là (1.95. Nếu chúng ta thử nghiệm ba giả thuyết, xác suất má chúng 
ta đúng cả ba [dĩ nhiên] là: 0.95 x 0.95 x 0.95 = 0.8574. Như vậy, xác xuất có Ít 
nhất một sai lầm trang ha tuyên bố “có ý nghĩa thống kể” là: 1 — 0.8574 =U.1426 
(tức khuảng 14%). 


Nói chung, nếu chúng ta thử nghiệm n giả thuyết, và mỗi lần thử nghiệm 
chúng ta chấn nhận một xác suất sai lắm là p, thi xác suất có ít nhất 1 sai lắm 
trong n lần thử nghiệm đó là 1—{L— p}'. Khi số lần kiểm định là n = 10 và p = 
ũ.05 thi xác suất có ít nhất một kết luận sai lắm lên đến 401 


“Hài học” rút ra từ cách lí giải trên là như sau: nếu chúng ta đọc một bải 
báo khoa học mà trong đó nhà nghiên cứu tiến hành nhiều thử nghiệm khác 
nhau với các kết quả trị số P < 0.05, chúng ta cỏ lí da để cho răng xác suất mà 
một trong những cái-gọoi-là "signilicant” (hay “có ý nghĩa thống kế”) đó rất cao. 
Chúng ta cẩn phải đẻ đặt với những kết quả phân tích như thể. 

Đối với một người làm nghiên cứu, ý nghĩa của vấn để thử nghiệm nhiễu giả 
thuyết là: không nên “cầu cả” Xin nỏi thêm về khải niệm “câu cả” trong khoa học. 
Hãy tưởng tượng. một nhà nghiên cửu muốn tìm hiểu hiệu quả của một thuật 
điểu trị mới cho các bệnh nhãn đau khớp. Sau khi xem xét các nghiên cứu đã 
công bố trong y văn, nhà nghiên cửu quyết định tiến hành một nghiên cứu trên 
30M bệnh nhãn: nhẫn nửa được điểu trị bằng thuật mới, nhản nửa chỉ sử dụng giả 
dược. Sau thời gian theo dõi, thu thập đữ liệu, nhà nghiên cứu phản tích và phát 
hiện sự khác biệt miữa hai nhóm không có ý nghĩa thống kê. Nói cách khác, thuật 
điểu trị không có hiệu quả. Nhà nghiên cứu không chịu “đầu hàng”, nên tìm cho 
được một kết quả có ý nghĩa thống kê: chia hệnh nhắn thành nhiều nhóm then 
độ tuổi (trên 50 hay dưới 50), theo giới tỉnh (nam hay nữ), thành phần kinh tế 
(cỏ thu nhập cao hay thấp). và thỏi quen (chơi thể than hay không). Tỉnh chung, 
nhà nghiễn cứu có 1õ nhóm khác nhau, và có thể kiểm định 16 giả thuyết. Nhà 
nghiên cứu “khám phả” thuật điểu trị có ý nghĩa thống kẻ trang nhám phụ nữ 
tuổi trên 5Ú và có thu nhập cao. Và, kết quả trên được công bổ. Đó là một qui 
trinh làm việc má giới nghiên cứu khoa học gọi là “ñshing expediHon” (một 
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chuyến đi câu cá). Tất nhiên, một kết quả như thế không có giá trị khoa học và 
không thể tin được. (Với lẽ kiểm định giả thuyết và với P = .05, xác suất má 
một kiểm định có kết quả ”significant” lên đến 55%, do đó chúng ta chẳng ngạc 
nhiên khi thấy có một “con cả” được hảH] 


Để cho kết quả trị số P có ý nghĩa nguyên thủy của nó trong hối cảnh thử 
nghiệm nhiều giả thuyết, các nhà nghiên cứu để nghị sử dụng thuật điều chỉnh 
Bonferroni (tên của một nhả thống kê học người Ý từng để nghị cách làm nảy). 
Theo để nghị này, trước khi tiến hành nghiên cửu, nhà nghiên cứu phải xác định 
rõ giả thuyết nảo là chỉnh, và giả thuyết nào là phụ. Ngoài ra, nhà nghiên cứu củn 
phải để ra kế hoạch sẽ thử nghiệm hao nhiêu giả thuyết trước khi phân tích đữ 
liệu. Chẳng hạn như nếu nhà nghiên cứu có kế hoạch thử nghiệm 2ñ so sánh và 
muốn giữ cho trị số P ở 0.05, thi thay vi dựa vào 0.05 là tiêu chuẩn để tuyên hổ 
“sigpnilcant, nhả nghiên cứu phải dựa vào tiêu chuẩn 0.0025 (tức lấy 0.05 chia 
cho 20) để tuyên bố “sipnihcant” Nói cách khác, chỉ khi nào một kết quả cỏ trị 
số J thấp hơn (0025 (hay nói chung là P/m) thì nhà nghiên cửu mới có “quyển” 
tuyên hế kết quả đỏ có ý nghĩa thống kẽ. 

4.3. Ý nghĩa thống kê không tương đương với ý nghĩa lâm sàng 

Một sai lầm rất phổ hiến trong giới y khoa là xem một khác biệt có “ý nghĩa 
thống kể” (statistical sigpnihcance) tương đương với “ý nghĩa lãm sảng” (clinical 
simiicance)}. Có thể xem trị số P được tính toán từ tỉ số của tín hiệu (signal, mức 
độ khác biệt giữa hai nhóm] và nhiễu (noise hay độ dao động của mắu). Gọi T là 
kiểm định thống kẻ, 5 là tín hiệu, và E là nhiễu, ý tưởng trên có thể mỗ tả như sau: 

bì 


T=— 
E 


Khi số lượng cũ mẫu tảng vả nếu 5 bất biến thì T sẽ tăng, tức có cơ hội đạt 
ý nghĩa thống kẽ. Điểu này có nghĩa là chủng ta có thể giảm E tối đa bằng cách 
tăng số lượng cỡ mẫu, và nó cũng có nghĩa là mắt khác biệt rất nhà chẳng củ ÿ 
nghĩa gì trang thực tế nhưng vẫn có thể cả ÿ nghĩa thống kê. Ngược lại, một khác 
biệt hay ảnh hướng (effect) lân, nhưng nếu số lượng cũ mẫu không đẩy đủ không 
thể tằạ† được ngưng chuẩn “có ý nghĩa thẳng kể” (tức P > 0.05). 

Bảng 2 sau đây trình bày 4 nghiên cửu (tưởng tượng) với số cỡ mẫu khác 
nhau, từ 20 đến 2.000.000 bệnh nhãn. Cột “Kết quả” trình bày số bệnh nhân 
được điểu trị đứt bệnh và số trong ngoặc là phần trăm. Giả thuyết vũ hiệu là xác 
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suất kết quả Ù.5 (tức 50%). Tất cả 4 nghiên cứu đều có trị số P = 0.041. Như có thể 
thấy qua bảng nảy, nghiên cửu l có tỉ lệ ảnh hưởng cao và có ý nghĩa lãm sảng 
(75%), và chỉ với 20 bệnh nhân, các nhà nghiên cứu có thể bác bỏ giả thuyết HÚ. 
Nhưng nghiên cứu 4, mức độ ảnh hưởng rất thấp (chỉ 50.7%, tức chỉ cao hưữn 
giả thuyết võ hiệu 0.07%} nhưng vẫn có ý nghĩa thống kê vì số cử mẫu quả Lớn! 


Bảng 2. Ảnh hưởng của cũ mẫu đến trị số P 


Kết quả điểu trị 


Trong thực tế, có rất nhiều nghiên cứu mả độ khác biệt miữa hai nhóm rất 
nhỏ, nhưng vẫn có ý nghĩa thống kẻ [9-10]. Điểu đăng quan tắm là kết quả có ý 
nghĩa thống kẻ như thế được các nhà nghiên cứu diễn dịch với hàm ý có ý nghĩa 
lãm sảng. 


Hm | lái | Eài 


Ngược lại, có những nghiên cứu mà kết quả có ý nghĩa lắm sảng nhưng vì 
không đạt ngưỡng chuẩn P < 0.05, nên các nhà nghiên cửu lại diễn giải rằng 
không có ý nghĩa lầm sàng! Chẳng hạn như một nghiên cứu về hiệu quả của bổ 
sung vitamin C và E ở phụ nữ mang thai [11 |, các nhà nghiên cứu kết luận rằng 
“Supplementaton with vitamin C and E during nregnancy does not reduce the 
risk of serious nutcomes in their infants” (Bổ sung vitamin C và E không làm 
giảm các triệu chứng lằm sàng nghiêm trọng). Nhưng khi xét qua số liệu thực tế 
thi thấy ở trẻ em mả mẹ có bổ sung vitamin C và E, tỉ lệ với triệu chứng lầm sảng 
giảm đến 21% (P = 0.06). Chỉ vi P = Ú.06 mà các nhà nghiên cứu có xu hướng 
diễn dịch sai kết quả, vả sai lầm này rất nghiêm trọng! 
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NHỮỪNG NGỘ NHẬN THÔNG THƯỜNG VỀ TRỊ SỐ P 

Nếu P = 0.5, xác suất mả giả thuyết vỏ hiệu đúng là 5%. 

2. Một kết quả với P > 0.05 (không có ý nghĩa thống kê) có nghĩa là 
không có khác hiệt giữa hai nhóm. 

._ Một kết quả cỏ ý nghĩa thống kê cũng có ý nghĩa lãm sảng. 

_ Những kết quả cỏ cùng trị số P là hãng chứng nhản hiện lại giả thuyết 
vỗ hiệu. 

._ P=05 có nghĩa là đữ liệu quan sát được chỉ xảy ra 5% khi giả thuyết 
vỏ hiệu đúng. 

6. P=0.05 và P< 0.05 có ý nghĩa như nhau. 

._ Trị số P phải viết một cách nghiêm chỉnh là P < 0.02 khi P= 0.015. 


._ P=05 có nghĩa là nếu chúng ta bác bỏ giả thuyết vỏ hiệu thì xác suất 
sai sốt loại I là 5%. 


._ Với ngưỡng P= 0.05, xác suất sai sót loại I là 5. 


.- Một kết luận khoa học nên dựa vào trị số P có ý nghĩa thống kê hay là 
không. 
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12 
BIAS TR0NG NGHIÊN CƯU Y HỤC 


relationship} giữa A và B. Ở đây, A có thể là can thiệp thật, yếu tố nguy cơ 
như cao huyết áp, hút thuốc lá, lạm dụng bia rượu, thiểu vận động thể lực. 
Còn B là một hiến cổ lãm sảng, có thể là bệnh tật. Khi một mỗi liên hệ được phát 
hiện, một loạt câu hỏi cẩn phải đặt ra để đảm bảo mỗi liên hệ là nhân quả. Bốn 
cầu hỏi đặt ra là mỗi liên hệ này có phải do: 
«® Yếu tổ ngẫu nhiên? 
s«_ Bias và vẫn để do lưững 
s« Yếu tổ nhiễu? 
s®- Do ảnh hưởng nghịch đản? 


Khi cầu trả lời cho tất cả 4 câu hỏi trên đếểu là “không” thì chủng ta mới có 
thể kết luận về một mỗi liên hệ nhãn quả. 


P- lớn các nghiên cửu y học muốn tìm mỗi liên hệ nhẫn quả (causal 


1. Yếu tổ ngẫu nhiên? 


Có thể nói một cách đơn giản là tất cả những gì chúng ta quan sắt được hay 
đo lưỡng được có thể thể hiện qua công thức: 


Quan sát = Sự thật + Nhiễu + Ngẫu nhiên 


Nói cách khác, giả trị quan sát bằng giá trị thật, cộng với nhiễu, và yếu tổ 
ngầu nhiên. Trung nghiễn cứu khoa học, trị số P là một thước đo để đánh giá 
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yếu tố ngẫu nhiên. Như để cặp trong phần giải thích về trị số P. chúng ta có thể 
xem trị số P là một chỉ số ngạc nhiên. Trị số P cảng nhỏ, độ ngạc nhiễn cảng cao; 
ngược lại một kết quả với trị số P cao (chẳng hạn như 0.3) thì độ ngạc nhiên 
thấp, tức yếu tổ ngẫu nhiên cao. 


Ngưỡng để xác định “ngạc nhiên” là P = 0.05 (hay 594). Những kết quả nào có 
E <1ñ.05 được xem là "có ÿ nghĩa thống kế hàm #ý nói kết quả đó rất có thể không 
phải do yếu tổ ngẫu nhiên. Nhưng P = 0.05 là một ngưỡng rất chung, và chẳng có 
cử sử khoa học nào cả. Da đỏ, khi diễn giải kết quả nghiên cứu khoa học, chúng 
ta không nên quả lệ thuộc vào ngưỡng 1.05, mả phải chủ ý đến ý nghĩa lãm sảng. 


Công trình nghiên cứu Women Healths Initiative (W HH) nghiên cửu về ảnh 
hưởng của tiêu thụ chất béo trên ung thư vú [1 |. Trong phần kết quả về ung thư 
vú mang tỉnh xăm nhạm (invasive breast cancer}, bảng tắm tắt viết rằng tiêu thụ 
it chất béo không miảm nguy cư ung thư vủ một cách có ý nghĩa thống kẻ. Nhưng 
khi xem xét kết quả, chúng ta thấy RR =0.91 (khoảng tin cậy 95%, 0.83 - 1.01) và 
P=.0?7. Với trị số E, tác giả có thể nói răng ảnh hưởng không có ý nghĩa thống 
kẻ. Nhưng với RR Ú.51, tức ăn it chất héo giảm nguy cơ ung thư vú 9%, vả tỉ lệ 
giảm có thể là 17% nhưng cũng có thể tăng 1%. Nói cách khác, kết quả nghiêng 
hắn về phần lợi ích (cho dù P = 0.07), nhưng tác giả lại không chú #1 

Cẩn phải cẩn thận với những nghiên cửu kiểm định quả nhiễu giả thuyết vả 
có quá nhiều trị số E Nên nhớ rằng mỗi lần kiểm định 1 giả thuyết, nhà nghiên 
cứu chấp nhận sai sót 5u và đúng 95. Do đó, một nghiên cửu kiểm tra 5Ú giả 
thuyết thi xác suất đúng tất cả trong 5Ú giả thuyết là (0.95}2 = 0.077; nói cách 
khác, xác suất có ít nhất một kết quả có ý nghĩa thống kẻ nhưng hoàn toàn ngắu 
nhiên là 0.923 hay 92.3. Do đó, đối với một nghiên cứu cỏ nhiễu so sảnh, và 
trong số đó có 1 hay 2 kết quả có ý nghĩa thống kẻ, cần phải cảnh giác, vì rất có 
thể đỏ chỉ là những kết quả mang tính ngẫu nhiên. 


2. Bias 

Bias (đọc là bai-as} là một thuật ngữ rất khó dịch sang tiếng Việt, và da đó, 
tôi tạm thởi dùng thuật ngữ đó trang sách. Một cách đễ hiểu và đơn giản, hías 
là hiện tượng xảy ra khi kết quả nghiên cứu sai lệch với sự thật một cách có hệ 
thống. Kết quả nghiên cửu là nói chung, nhưng trong thực tế, chúng ta cũng có 
thể nỏi về bias trong suy luận. 

Chủ ý câu định nghĩa có để cận đến “sai lậch có hệ thống”, khác với sai lệch do 
yếu tổ ngẫu nhiên. Trong nghiên cửu, sai sốt có hệ thống có thể bao nấm: 
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s® Do tuyển chọn sai đối tượng, còn gọi là selectian bias; 

« Thông tin hay dữ liệu sai (infarmaiian bíns}]; và 

« Nhiễu (conjnuniline)} 

2.1. Selertinn bias có lễ là luại bias phổ biến nhất và dễ dẫn đến diễn giải sai 
lầm. Chọn sai đỗi tượng nghiên cứu đẻ dẫn đến số liệu thu thận được không cỏ 
giả trị so sánh. Một nghiên cứu có vấn để về selectHion bias có thể dẫn đến kết quả 
hị sai lệch và kết luận sai. Selection hias thường hiện diện trong các nghiên cửu 
quan sắt, và rất hiếm trong các nghiên cứu RCT. 


Chẳng hạn như nhà nghiên cứu muốn tìm hiểu mối liên quan giữa nghiện 
rượu và viêm phối, vả thiết kế nghiên cứu theo mô hình nghiên cứu bệnh chứng 
(case control design). Giả dụ như nhà nghiên cửu quyết định chọn nhằm hệnh từ 
các bệnh nhân nhập viện. Vấn để của nghiên cứu nảy là người nghiện rượu (yếu 
tổ nguy cơ) thưởng hay bị nhập viện. Do đỏ, chụn nhóm bệnh từ bệnh viện, thì 
xúc suất người nghiện rượu cũng gia tăng và chưa chắc nhản ảnh đúng thực tế. 

Để minh họa cho ý trên, chúng ta có thể tưởng tượng 2 tỉnh huống: ngoài 
quẩn thể và trong bệnh viện. Giả dụ như ngoài quân thể không có mỗi liên quan 
giữa nghiện rượu và viêm phổi: 


Nhóm bệnh Nhóm chứng 
(viêm phối] (không viêm phối) 
Nghiện rượu 1ũ lũ 
Khủng nghiện rượu 9ù 9 


ÖR = (10 x 90) 7 (90 x 10) = 1. Không có liên quan. 


Nhưng nếu chọn nhóm chứng trang bệnh viện, xác suất là nhóm nghiện 
rượu sẽ tảng cao so với cộng đồng. Do đó, khi phân tích chúng ta sẽ có CR = 
2.25, tức nghiện rượu có liên quan đến tăng nguy cơ viêm phổi. Đó là một kết 
luận sai, do cách chọn bệnh nhân không đúng. 


Nhóm bệnh Nhóm chứng 
(riêm phổi) (không viêm phổi) 
Nghiện rượu 20 1ũ 
Không nghiên rượu 8ũ gũ 


ÖR = (20 x 90} / (80 x 10) = 2.35. Nghiện rượu tảng nguy cơ viêm phối. 
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Một dạng hias khả phố biến trong các nghiên cứu bệnh chứng là Berksons 
bias da hác sĩ Berkson mỗ tả lần đẩu vào năm 18946 [2|. Loại bias này có khi còn 
cỏ tên là admission-rate bias. Nhiều nhà nghiên cứu vì lí do tiện lợi thưởng hay 
chọn nhỏm chứng trung hệnh viện, thay vi chọn tử cộng đồng mà bệnh phát 
sinh. Theo Berkson, tỉ lệ mắc bệnh x trong những người nhận viện vì bệnh y sẽ 
hbias khi so sánh với quần thể mà bệnh viện nhục vụ. Nỏi cách khác, loại bias này 
là hệ quả của sự khác biệt về tỉ lệ nhập viện giữa nhóm hệnh và nhóm chứng. 


Trong một nghiên cứu bệnh chứng thực hiện trong bệnh viện [3], các nhà 
nghiên cửu tìm hiểu một số yếu tổ nguy cơ cha ung thư bladder bàng quang. 
Trong số các yếu tổ nguy cơ họ phát hiện có hút thuốc lá mảm nguy cơ ung thư 
hàng quang (OR = 1.3; KTC95%: 0,8 - 2.5)! Sau này, khi họ phản tích lại dữ liệu 
và xem xét đến khả năng Berkson bias có thể xảy ra trong phản tích trước [4]. Họ 
loại hỏ các bệnh nhãn với bệnh đường hỗ hấp tử nhỏm chứng vì các bệnh nhân 
này có xác suất cao bị phơi nhiễm hút thuốc lá cao hơn so với ngoài cộng đẳng. 
Sau khi hiệu chỉnh cho loại bias này, họ nhát hiện hút thuốc lá tăng nguy cơ u_ng 
thư bảng quang (ÖR = 1.78; KTC95%: 1.05 - 2.99). Đây là một trang những ví dụ 
sinh động về ảnh hưởng của hias trong nghiên cứu bệnh chứng. 


Một kinh nghiệm về selection bias sinh động nhất và có ý nghĩa nhất là mỗi 
liên hệ giữa thay thể hormone (HRT) và ung thư vú. Đến giữa thập niên 1990, 
HRT trở thành một trong những thuốc được dùng ở phụ nữ sau mãn kinh, đặc 
hiệt ở các nước Hắc Mĩ. Lí do là trước đỏ có rất nhiều nghiên cứu quan sát cho 
thấy những người dùng HRT lâu dài có nguy cơ thấp về bệnh tim mạch. Điển 
giữa thập niên 1990, một công trình nghiên cứu lắm sàng đổi chứng ngẫu nhiễn 
(RCT) có tên là Heart and Esirngen-prngesiin Replacemeni Study hay HERS thật 
ra tăng (chứ không giảm) nguy cơ bệnh tìm mạch. Đến năm 2002, một RCT thử 
hai thuộc nhóm WHIT cũng đi đến kết luận răng HIRT tăng nguy cử bệnh tim 
mạch vả ung thư vú ở phụ nữ sau mãn kính. Kể từ đỏ, số phụ nữ dùng HRT giảm 
nhanh, và cho đến nay có thể nói là không đáng kể. 


Tại sao có sự khác biệt quả lớn giữa nghiên cửu quan sát và RCT? Cầu trả 
lời là bias. Loại bias đấu tiền được mô tả như là “henlthy aser bías, tức người 
quan tầm đến sức khỏe và có những hành vi tốt cho sức khỏe là những người 
rất khác với những người không quan tâm đến sức khỏe. Trong các nghiên cứu 
quan sát, những phụ nữ dùng HRT rất khác với những người không dùng HRT: 
họ thường có Ít yếu tổ nguy cơ, không hẻo phi, có học vấn khả cao, giàu củ, vả 
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rất quan tâm đến sức khỏe. Tương tự, những người tuần trị (tuän theo phác đã 
điểu trị của bác sĩ) cũng là những người có học, thuộc thành nhân trung lưu, và 
cũng quan tắm đến sức khỏe. Những người nảy không có nguy cơ mắc bệnh tim 
mạch hay ung thư cao. Vì thể khi nghiên cửu quan sắt so sảnh nhóm dùng HRT 
với nhóm không dùng HRT, chúng ta có thể kì vọng nhóm dùng HRT có nguy cơ 
hệnh thấn, không phải vị HRKT mà vì thành phẩn đổi tượng quá khác với nhóm 
không dùng HRT. 

Do đó, khi ứng dụng mỏ hình RCT để đánh giá HRT thì khách quan hơn. 
Theo mö hình RCT: phụ nữ được chia thành 2 nhỏm một cách ngẫu nhiên lúc 
hạn đấu, và vì chia nhóm ngắu nhiên, nên các yếu tố liên quan đến bệnh đểu 
được cân bằng. Điểu nảy cho phép các nhà nghiên cửu so sánh nguy cơ bệnh 
giữa hai nhóm (sau một thởi gian điểu trị) khách quan hơn. Họ có thể phát hiểu 
về mỗi liên hệ nhãn quả, bởi vì sự khác biệt bãy giữ chỉ là nhằm được điểu trị và 
nhóm không được điểu trị. Quả thật, khi dùng mỗ hình RCT, chúng ta có một 
kết quả khả tin hơn là nghiên cửu quan sắt. 

2.2. m[ormatian bias 


Iniormation bias theo tôi nên gọi là menasuremenf bías, vì bản chất của vấn để 
liên quan đến đo lường. Một cách ngắn gọn, rnfnrrmalinn bías hay rmeasurernenf 
bíns là hệ quả của việc sai sót trong đo lưỡng, xác định yếu tổ phơi nhiễm và 
bệnh (hay øutcome), đồng thời có thể dẫn đến tình trạng lẫn lận háa thông tín 
(misclassiltcaiian). Hệ quả là đối tượng nghiên cứu có thể hị phần nhóm sai, và 
dẫn đến ước tỉnh các hệ số tương quan cũng sai. 


Cỏ thể nói bất cứ phương pháp đo lưững nảo, dủ là sinh hóa hay vật lí, cũng 
có sai sót: sai sót kĩ thuật, sai sốt ngẫu nhiên, sai sót do dao động sinh học trong 
mỗi cá nhắn, v.v... Nếu nghiên cứu phải nhãn nhóm dựa trên các đo lường như 
thế, rất dễ dẫn đến sai lắm. Chẳng hạn như đo lường mật độ xương (bone mineral 
density} cỏ thể dùng để nhẫn loại bệnh nhẫn lnäng xương và không luãng xương, 
nhưng vì do sai sốt trong đo lưỡng, nên việc phản nhóm hệnh có thể sai. 

Một sai sót trong đo lường có thể là do cách đo lường phi chuẩn. Chẳng hạn 
như để đo lường chiếu cao, các nhà nghiên cứu có thể cho phép đối tượng mang 
giày. Nhưng để tránh sai sót, các nhà nghiên cứu cỏ kinh nghiệm thưởng đo 
chiếu cao khi đối tượng không mang piảy. 
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Nhiễu nghiên cứu quan sát dựa vào phỏng vẫn đổi tượng nghiên cửu. Khi 
phỏng vấn có nhiễu dạng hias có thể xảy ra, kể cả inierviewer bías, recnÏl híns. 


Imierviewer bias xây ra khi người phỏng vẫn hỏi câu hỏi một cách khác nhau 
giữa nhóm bệnh và nhóm chứng. Một khi người phỏng vấn nghi ngữ đối tượng 
là người có bệnh, họ thưởng tặp trung đảo sẵu những yếu tổ nguy cơ mà họ nghĩ 
cỏ liên quan, trong khi đó họ không có cùng cầu hỏi cho nhóm chứng! Trường 
hợp này cũng làm tăng odds ratio khi phần tích. 


Recnll hias hay reshonse bías, reparting bĩías là một loại sai sót có hệ thống 
(systematic error} da khác biệt về độ chính xác trong việc hồi tưởng lại những sự 
kiện trong quá khứ. Chẳng hạn như trong một nghiên cứu bệnh chứng có mục 
tiêu xác định yếu tổ nguy cơ liên quan đến việc bộc phát dịch salmonelÌa truong 
thực phẩm, các nhà nghiên cửu phải phỏng vẫn những người bị nhiễm và người 
không bị nhiễm. Trong trưởng hợp này, người bị nhiễm có thể nhớ chính xác 
những sự kiện và dữ liệu hơn nhóm chứng bởi vì họ bị nhiễm nên rất quan tẫm 
đến hệnh trạng và yếu tổ nguy cơ. Loại respanse hias nảy sẽ làm tăng giá trị của 
odds ratio, tức có thể dẫn đến kết luận sai. 


3. Ảnh hưởng nghịch đảo - Reverse Ássociation 

Trang nghiên cứu y học, các nhà nghiên cửu có thể tím ra mỗi liên quan 
giữa yếu tổ nguy cơ (X) và bệnh (Y). Khái niệm ảnh hưởng nghịch (reverse 
qssariatian, có khi để cập đến nhiễu tên như resiiwual confouniling, reverse 
causalit, canfuauniler hy imilicaHian) để cập đến hiện tượng Y ảnh hưởng đến X 
(thay vi X ảnh hưởng Y). 

Có thể mình họa bằng một ví dụ mang tính giả thuyết. Một nghiên cứu bệnh 
chứng về mỗi liễn quan giữa thiếu vitamin D và bệnh lao phối (TBE). Kết quả 
nghiên cứu có thấy thiếu vitamin D tăng nguy cơ bệnh TB. Nhưng một diễn giải 
khác cũng cẩn phải xem xét đến: người hị TB it tiếp xúc với ảnh nắng mặt tri, 
và do đỏ, họ thiếu vitamin D. Đỏ là khả nắng reverse association, tức có thể TB 
là yếu tổ dẫn đến thiếu vitamin D (chứ không phải vitamin D là yếu tổ nguy cơ 
của T}. 

3.1. Canfaumiling by Indicatian 


Đây là một loại bias thưởng hay xảy trong các nghiên cứu bệnh chứng liên 
quan đến thuốc. Bias xảy ra khi các đối tượng dùng thuốc có đặc tính lắm sảng 
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khác (vi lí da lãm sàng) với người không dùng thuốc. Sử dụng thuốc chống trẩm 
cảm củ thể cỏ liên quan đến nguy cơ võ sinh (infertility). Tuy nhiên, trẩm cảm 
tự nỏ cũng là một yếu tổ nguy cơ của vũ sinh. Do đỏ, khi nghiên cứu về thuốc 
chống trầm cảm và vỏ sinh có thể dẫn đến kết luận sai. 


Một dạng bias khác trong nhóm nảy là “canfnunrling bự canirnindlicaHam." VÌ 
dụ như trang một nghiên cứu bệnh chứng về mỗi liên quan miữa thuốc analpesic 
và suy thận, các nhà nghiên cứu so sánh những bệnh nhân từng dùng analgesic 
giữa bệnh nhân được chạy thận (dialysis) và nhóm chứng, tức không mắc hệnh 
thận. Giả dụ răng bệnh nhắn chạy thận được bác sĩ khuyến cáo tránh dùng 
aspirin vì khả năng ảnh hưởng đến máu đông (và thay vào đó bệnh nhãn có thể 
được khuyên dùng acetaminophen). Nếu nhỏm chạy thận có những người được 
chạy thận lầu năm, điểu này có thể dẫn đến tình trạng giảm tần số dùng aspirin 
và tăng tần số acetaminophen trong nhóm hệnh. Từ đỏ, một mỗi liên quan giữa 
aspirin và suy thận có thể sẽ thấp hơn thực tế, trong khi đỏ mỗi liên quan giữa 
acetaminophen vả suy thận sẽ cao hơn thực tế. 

3.2. Nghịch lí Simipsam (Simpson Paradax) 

Một trong những hình thức của ảnh hưởng nghịch đảo là “Nghịch lỉ Simpson, 
được nhả thống kê học Edward 5impson mỗ tả lần đẩu vào năm 1951 (tuy nhiễn 
hiện tượng nảy đã được ghi nhận trước đỏ khả lân) [5]. Nghịch lí Simpson có 
thể định nghĩa như là một sự ảnh hưởng không nằm trong kỉ vọng khi tổng hợp 
nhiễu nhóm nhỏ. Nếu chúng ta quan sắt ảnh hưởng của một can thiệp trang ba 
nhóm À, B, C một cách nhất quản, nghịch lí 5impson tiên đoán rằng nếu chúng 
ta tổng hợp dữ liệu của ba nhóm thành một quần thể, thi ảnh hưởng của can 
thiện trang quần thể có thể ngược lại với ảnh hưởng trong từửng nhóm! 

Bảng dưới đây là một dữ liệu thật trích tử một nghiên cứu dịch tễ học. Các 
nhà nghiên cửu quan sắt tỉ lệ tử vong ở nam và nữ của hai nhóm bệnh nhân phân 
nhóm theo giới tính. Kết quả cho thấy ở nam, tỉ lệ tử vong ở nhóm can thiệp thấp 
hơn nhóm chứng ở cả nam (40% so với 5056] và nữ (58 so với 1580). 


Nam Nữ 
Tử vang ng Tử vung ng 
Can thiện 8ñ (40) 120 5 (5M) 05 
Chứng 20 (50%) 30 38 (15%) 321 
- I7 - 


Tuy nhiên, khi các nhà nghiên cứu tổng hợp nam vả nữ thành một nhóm như 
bảng số liệu dưới đây: 


Nam + Nữ 
Nhóm C"TH..= Ws Sống 
Can thiện 85 (28W%} 215 
Chứng 5g (20%) 241 


thi tỉ lệ tử vong trong nhỏm can thiệp lại cap hơn nhóm chứng (2814 so với 2096). 

Hiện tượng này xảy ra, vì sự phản bố nhỏm (hay yếu tổ nguy cơ) mất cản đổi 
giữa các nhóm đối tượng. Chẳng hạn như chúng ta thấy ở nam, số đổi tượng 
trong nhám can thiệp cao gấp 5 lần nhóm chứng, củn ở nữ, số đối tượng thuộc 
nhóm can thiệp thi rất thấp (100) so với nhóm chứng (260). Trong trường hợp 
này, phản tích hãng cách gộp hai nhóm nam và nữ có thể cho ra kết quả sai. Tuy 
nhiên, nếu nhả nghiên cứu có kính nghiệm, họ có thể sử dụng nhương pháp 
phân tích thống kê để hiệu chỉnh cho sự mất cân đối nhóm. 

Hiện tượng nghịch lí 5impson thưởng hay thấy trong nghiên cửu quan sắt vì 
cách nhân nhóm một cách “tự nhiên. Điều này dẫn đến sự mất cần bằng trong 
phản nhóm và kết quả chung có thể bị nhiễu/sai. Do đỏ, diễn giải kết quả của 
nghiên cứu quan sát, nhất là kết quả tổng hợp, cần phải hết sức cẩn thận vì có thể 
chịu sự chỉ phối của nghịch lí Simpson. 


4. Yếu tổ nhiễu (confounding factor)} 


Chữ confaunder xuất phát tỉ tiếng Latin confundlere có nghĩa là pha trộn vào 
nhau. [1a đá, định nghĩa của confaunrling theo Rathman là ảnh hưởng của yếu 
tổ phơi nhiễm hị lẫn lộn với ảnh hưởng của một yếu tổ khác và dẫn đến bĩas [6]. 
Một định nghĩ khác: Nếu A là yếu tế nguy cơ của bệnh D, và X là yếu tổ nhiễu 
(confnaunder) thì X phải đáp ứng hai điểu kiện: 

s« X là yếu tổ nguy cơ của bệnh D 

sX có liên quan đến yếu tổ Ä 


Ví dụ: Trong một nghiên cứu về mỗi liên hệ giữa loãng xưững (osteoporosis) 
và viêm khớp xương (osteoarthritis, À), các nhà nghiên cứu phát hiện bệnh 
nhân OAÁ có nhiều người bị loäng xương hơn nhóm không bị OÁ. Trong nhóm 
ÖA, có gần 22% hị loãng xương, trung khi đỏ trong nhóm không bị DA, chỉ có 
Rú bị luãng xương. 
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OA Không OA 
Luäng xương 21.7% 8.1% 
Có thể kết luận laãng xương là một yếu tổ nguy cơ của CÀ? Chưa chắc chân. 
Li do là mối liên hệ này có thể chịu sự tác động của một yếu tổ thứ ba: đó là độ 
tuổi. Bệnh nhãn 1Á thưởng cao tuổi, và cao tuổi cũng là yếu tổ nguy cử của 
luäng xương. Do đó, cần phải xem xét đến độ tuổi cho hai nhằm ĐÃ: 


0A Không 0A 
Luäng xưững 21.7% 8.1M 
Bộ tuổi (trung bình) 63 45 


Quả thật, độ tuổi trung bình của nhóm bệnh nhắn 0Á (63 tuổi) cao hơn 
nhóm chứng (45 tuổi). Sau khi điểu chỉnh cho độ tuổi, các nhà nghiên cứu không 
củn thấy mỗi liên quan giữa loäng xương và 1À. Trong trưởng hợp trên, độ tuổi 
là một yếu tổ nhiễu hay canfounder, vì độ tuổi vừa liên quan đến yếu tổ nguy cơ, 
vừa liên quan đến outcome tức CA. 

li & 

Tám lại, diễn giải kết quả nghiên cứu theo chiểu hướng đánh giá mỗi liên hệ 
nhắn quả, chúng ta cần phải đặt 4 câu hỏi chỉnh: 

s_ Kết quả này do yếu tổ ngẫu nhiễn gây nên? 

ø« Nếu không do yếu tế ngẫu nhiên, có phải do bias? 

s« Nếu không do bias và ngẫu nhiên, kết quả cỏ phải do yếu tổ nhiễu? 

« Nếu không do ngẫu nhiên, không do bias, không do yếu tổ nhiễu, thi có 

phải do ảnh hưởng nghịch đảo? 

Chỉ khi nản cầu trả lời cho 4 cầu hỏi trên là “không” thi chúng ta mới có 
chứng cử để có thể bản về một mỗi liên hệ nhãn quả. Thông thưởng, các nghiên 
cửu quan sát đểu có nhiều hbias và những ảnh hưởng nhiễu mả nhà nghiễn cứu 
rất khó kiểm soát được. 
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ĐÁNH GIÁ HIỆU QUÁ 
KINH TẾ - LÂM SÀNG 


thủa trên hai khía cạnh: lượng và chất. Phần lượng có thể ẩn lưng hãng 
cắc chỉ số sinh hẳn, giảm nguy cử tử vang hay nguy cũ mắc bệnh. Phẩn 
chất phản ảnh phẩm chất cuặc sñng mang tính đặc thù của một cá nhân. Một trang 
những chỉ số để nh giả chất lượng sống là QALY (quality - aÌjnsted li[e years). 
Trang chưng này, tôi sẽ giải thích chỉ sĩ QALY và cách từng dụng trang việc quyết 
định nhưng ăn điều trị và quản lỉ y tế 
Sự ra đời của nhiểu thuật điểu trị (kể cả dược phẩm) và chiến lược phòng 
ngửa bệnh đặt ra một câu hỏi quan trọng cho giới lãm sảng và làm chỉnh sách: lợi 
ích của các thuật điểu trị và chiến lược phỏng bệnh cỏ xứng đáng với đẳng tiền 
đấu tư? Các chiến lược phòng hệnh ở qui mỗ cộng đẳng thưởng cỏ chỉ phí rất 
lửn (vi phải áp dụng cho một số đồng quấn thể dẫn số) nhưng số ca hệnh ngửa 
có thể rất khiêm tổn. Mliột trong những vỉ dụ tiêu biểu của sự khó khăn trong 
quyết định chính sách là chiến lược phòng bệnh ung thư vú dựa vào xét nghiệm 
mammopraphy. 


H lêu quả của một thuật điều trị cần được thánh giá một cách khách quan 


Nhiễu thuấc mới tuy có hiệu quả lãm sảng tốt hay rất tốt, nhưng chỉ phi 
cũng có thể rất cao. Chẳng hạn như thuốc Siuienf (sunitinib} có hiệu quả làm 
chậm sự phát triển của ung thư khoảng 6 tháng, nhưng với cải giá 54000 USD. 
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Bevacizumah (Avastin)} là một loại thuốc cũng đặt giới quản lí y tế trong tỉnh 
thể nan giải. Thuốc được Cục quản lí thực nhấm và dược nhẩm Mĩ (FEDA}) phé 
chuẩn cho điểu trị ung thư ruột, ung thư phối và ung thư vú trong giai đoạn 
cuỗi. Nhưng giá của thuốc là một yếu tổ làm nhiễu người ngẵn ngại. Chỉ phi 
điểu trị, tùy theo trưởng hợp bệnh, cỏ thể dao động từ 50000 USD đến 100000 
USI2/näăm. Du với cải giá đó, Avastin đã trở thành một trong những thuốc điểu 
trị ung thư phổ biến nhất thể giới. Năm 2009, doanh thu từ thuốc này có thể đem 
về cho công ty Genetech khoảng 7 tỉ USD (trong đó, nẩn 65% từ thị trường Mi). 
Nhưng Avastin củn có một “hộ mặt” khác: khi xem xét kết quả nghiên cứu lắm 
sàng mới đây, thuốc chỉ có hiệu quả kéo dài tuổi thọ cho bệnh nhân khoảng vải 
tháng, chứ không phải một năm như trước kia (khi FDA phê chuẩn). Thuốc còn 
gây ra vài hiển chứng nguy hiểm. Những thuốc mới như Avastin hay Stutent là 
một trong những lỉ do chính làm cho chỉ phi y tế cảng ngày cảng gia tảng một 
cách đáng ngại. 


Không có quốc gia nào có nguồn ngân sách bất tận. [Do đó, việc thẩm định 
giả trị kinh tế về sức khỏe của con người đã được đặt ra, giá cả sức khỏe phải 
được đưa lên bản cần kinh tế để xác định loại thuốc nào hay thuật điểu trị nào 
đáng “đồng tiền hát gạo”. Theo trảo lưu đỏ, một bộ môn học ra đời: kính tế - y 
tế (health economics). Một trong những “chủ điểm” của ngành kinh tế - y tế là 
phân tích hiệu quả lãm sàng trang bối cảnh kính tế quốc dẫn, và từ đỏ để ra 
chỉnh sách sử dụng nguấn tải lực y tế một cách hữu hiệu hơn. 


Nhiểu câu hỏi được đặt ra trong kính tế - v tế: thể nào là “hiệu quả lãm sảng” 
(clinical cficacy); có phải làm chậm sự phát triển của tế bảo hay kéo dải thời gian 
sống là “hiệu quả lãm sảng”; bằng chứng khoa học cỡ nào để nhà nước có thể sử 
dụng làm quyết định chỉ ra hàng tỉ USD; ai là người quyết định; làm thể nào để 
cần bằng giữa lợi và hại, v.v... Ngay cả giới kĩ nghệ dược cũng cảm thấy không 
thoải mái với cải giá 50000 LISD để chỉ kéo dái thời gian sống 4 tháng. 


Năm 1999, chính phủ Anh quyết định thành lập một viện nghiên cứu kinh 
tế y tế có tên là NICE (viết tắt từ chữ National Tnstitute for Health and Clinical 
Excellence), với nhiệm vụ duy nhất là đánh giá hiệu quả kính tế của các loại 
thuốc và thuật điểu trị hiện nay ở Anh. Để làm việc này, NICE có một đội ngũ 
chuyên gia về làm sàng, dịch tế học, kinh tế, thống kẽ học phân tích hiệu quả lãm 
sảng và hiệu quả kinh tế. Trong vòng 5 năm sau khi NICE ra đời và với những 
công trình gãy ảnh hưởng lớn đến chính sách của họ, hàng loạt viện như thể 
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xuất hiện ở nhiều nước từ Mĩ sang Âu châu và Á châu. Một trong những phương 
tiện quan trọng nhất của NICE là chỉ số chất lượng sống và QALY mà tôi sẽ giải 
thích sau đảy. 


1. Chỉ số QALY 


Trong quả khứ, trước khi QALY ra đới, hiệu quả của một thuật điểu trị được 
đánh giá qua các chỉ tiêu và chỉ số lâm sàng. Chẳng hạn như thuốc điểu trị ung 
thư kéo dài tuổi thọ cho bệnh nhân, hay thuốc điểu trị loäng xương giảm nguy 
cử gãy xương, hay đối với thuốc điểu trị can huyết áp hiệu quả lắm sảng thường 
được đánh giá qua mức độ giảm huyết áp. Lu điểm của các chỉ số lâm sảng này 
là cỏ tính “đặc hiệu” cho từng bệnh (chẳng hạn như huyết áp đối với bệnh cao 
huyết áp, hay mật độ xưng với bệnh loãng xương), nhưng yếu điểm là hiệu quả 
lãm sảng dựa vào các chỉ số này khó có thể so sánh giữa các bệnh. Dao đó, nhu 
cầu cho một chỉ số thống nhất với đưn vị chung cho tất cả các bệnh được đặt ra. 


Các chỉ tiêu này được định lượng trên một quân thể qua nghiên cửu lãm 
sàng. Nhưng những chỉ số lắm sảng nảy chỉ phản ảnh khia cạnh “lượng, mà 
không phản ảnh phần “chất” Một bệnh nhân có thể kéo đải tuổi thọ một năm, 
nhưng trong một năm đỏ phải sống trong tỉnh trạng chất lượng sống thấp hay 
tỉnh trạng thực vật thì không thể xem là hiệu quả cao được. Do đả, cẩn phải có 
một chỉ số mới phản ảnh cả hai khia cạnh lượng vả chất. 


Để do lường chất lượng, các nhà nghiên cứu phỏng vẫn nhiễu người trong 
thời kì sức khỏe sung mãn. Hai khía cạnh chính được quan tảm là sức khỏe thể 
lực và tính thắn. Bộ câu hỏi EQ-5D [1| được sử dụng (xem phần dưới đảy về 
hộ câu hỏi). Các nhà nghiên cứu củn hỏi những ngưới này một năm sống xứng 
đáng bao nhiêu điểm trong nhiều tình huống khác nhau như sức khỏe sung 
mãn, khó khăn trong việc đi đứng, hay trong trưởng hựp phải năm liệt giường, 
hay trầm cảm/huốn rấn, v.v... Nói cách khác, những đối tượng nảy phải tưởng 
tượng ra những viễn cảnh họ chưa tửng kinh qua, và do đó, điểm hay thông số 
chất lượng mang tỉnh chủ quan. Kết quả của nghiên cứu nảy là một thông số 
củ tên là “utHlity, thưởng được hiểu như là “hệ số hữu dụng” trong kinh tế học, 
nhưng tôi sẽ để cập đến như là “hệ số chất lưựng sẵng”. 


Hệ số chất lượng sống có giả trị tử 0 đến 1. Hệ số băng ñ có nghĩa là chết, và Ì 
là trong tình trạng sức khỏe hoàn hảo. Chẳng hạn như nếu bệnh nhân có thể đi 
đứng hình thường, có thể tự làm vệ sinh cá nhãn, không có gì huổn phiển, nhưng 
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hay đau nhức thi hệ số chất lượng sống là 0.76. Nhưng nếu bệnh nhãn nắm một 
chỗ, trong tình trạng thực vặt, hệ số chất lượng sống có thể äm (như —Ũũ.42). Một 
số hệ số chất lượng sống có thể tham khảo qua bảng sau đây. 


Tỉnh trạng sức khỏe 


Đi đứng bình thưởng: tự chăm sóc và tự về sinh cá nhần; đau nhức; 
không buồn chắn 


Khỏ khăn trong đi đứng; khó khăn trong việc tự chăm sóc; đau nhức; 
hay buồn rấu 
Bi đứng bình thưởng; khỏ khăn trang việc tự mặc quần áo; không thể 


làm các việc hàng ngày; hay đan nhức; không bị trầm cảm 

Bi đứng khó khăn; cỏ thể tự mặc quấn ảo; có thể tự chăm sóc; hay đau 

nhức; bị trầm cảm | 
E4 đứng khó khăn; không thể tự lâm vệ sinh cá nhân; không làm 

những việc hàng ngày; hay đau nhức; bị trầm cảm 

Nằm một chỗ; không thể tự làm vệ sinh cá nhân; không làm những 

việc hàng ngày; hay đau nhức; bị trầm cảm 
| Chú thích: Các chỉ sổ trên đây củ thể tính toán trực tuyến tại địa chỉ sau đây: 

htip:/?www.oahsu.edu/encÍmdim/calculatar.htm 


Từ đó, các chuyên gia y tế nhát triển chỉ số QALY (quality adJusted life years, 
tạm dịch là số năm chất lượng sống}. Trang thực tế, QALY là tích số của hệ số chất 
lượng sống () và số năm sống [2-3]: 


QALY = U x số năm sống 


Do đó, QALY bằng l có nghĩa là một năm sống trong tình trạng sức khỏe 
hoàn hảo. Chẳng hạn như nến bệnh nhần 65 tuổi, mắc bệnh ung thư trực tràng, 
hệ số chất lượng sống là (1.95, và nếu bệnh nhắn còn sống 2ñ năm nữa, thì chỉ 
số QIALY là 0.95 x 20 = 18.6. tương tự, một bệnh nhãn sống 4 nắm với bệnh tim 
mạch (vả bệnh tim mạch cùng với những ảnh hưởng phụ của thuốc có hệ số chất 
lượng sống bằng ñ.6) thì chỉ số QALY của bệnh nhân là Ú.6 x 4 = 2.4. Nói cách 
khác, tuy bệnh nhãn sống 4 năm, nhưng thời gian đó chỉ tương đương với 2.4 
năm trong tình trạng sức khỏe houàn hảo. 
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2. Chỉ phí điểu trị và QALY 


Để tỉnh toán hiệu quả kinh tế của một loại thuốc hay nhương pháp điểu trị, 
các chuyên gia tính chi phí trên mỗi QALY. Cụ thể hơn, họ lấy chỉ phí điểu trị 
chia cha chỉ số QALY. Chúng ta có thể lấy một vỉ dụ về thay khớp xương hỗng 
(hip replacement} để mình họa cho phương pháp này. Thay thể khớp xương 
hông có thể cải thiện chất lượng cuộc sống cho bệnh nhân viêm khứn. Hệ số chất 
lượng sống. qua nghiên cửu, cho thấy có thể tăng từ ñ.8 (khi chưa điểu trị) lên 
ũ.9 (khi đã thay khớp xương), tức tăng ñ.I điểm. Nếu bệnh nhân là nữ và 65 tuổi, 
thi theo tuổi thọ trung bình trong dân số, bệnh nhắn có thể sống thêm được 15 
năm. Do đó, chỉ số QALY lả: 


QALY=l5x0.1l=1.5 


Nếu chỉ phi của toàn hộ khâu điểu trị, kể cả nhẫu thuật, là 5.000 LI512, thì hệ 
số hiệu quả kinh tế là: 5000/1.5 = 3333 USD. Tức hệnh nhắn (hay nhà nước) chỉ 
chỉ 3333 USD để kéo dải 1 năm OÁLLY, một chỉ phí được xem là rất hiệu quả. 


Một ứu điểm của QIALY là nó cho phép chúng ta so sánh hiệu quả giữa 2 loại 
thuốc hay 2 thuật điểu trị. Giả dụ chúng ta có 2 thuốc để điểu trị một hệnh mãn 
tính. Thuốc Ä có thể kéo dài tuổi thọ cho bệnh nhản 4 năm, với hệ số chất lượng 
sống tăng từ ñ.2 (chưa điểu trị) lên .4 (trong khi điểu trị), và tốn 10000 USD. 
Thuốc B kéo dài tuổi thọ bệnh nhân chỉ 6 tháng, nhưng với hệ sống chất lượng 
sống tăng tử ñ.2 đến 0.7, với cải giá 2000 LISD Làm sao để so sánh hiệu quả kinh 
tế và lắm sàng của hai lnại thuốc? 

Chúng ta cỏ thể bắt đầu bằng cách tỉnh chỉ số QIALY của hai loại thuốc như 
SAU: 

QALY cho thuốc À = 4 x ñ.3 = 0.8 
QALY cho thuốc B = Ũ.5 x 5 = 0.35 


Hệ số hiệu quả của thuốc A là 10.000 / 0.8 = 12500 USI2, và thuốc B: 2000/ 
.35 = 8000. Với cách sa sánh này chúng ta thấy thuốc B có hiệu quả kinh tế hơn 
thuốc À, dù thuốc B kéo dải tuổi thọ bệnh nhän chỉ 6 tháng. 

QAALY còn có thể ứng dụng cho một quản thể và giúp cho các nhà quản lỉ y 
tế một phương tiện quan trọng để phân chia ngắn sách. Giả dụ một nhắm gốm 
1000 bệnh nhân cao huyết áp được điểu trị bằng một loại thuốc với tổng chỉ phí 
là 1 triệu USD. Thuấc điểu trị, theo kết quả nghiên cửu lãm sảng, có hiệu quả 
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ngắn ngừa 1 ca nhi máu cơ tìm nặng và Ì ca nhi máảu cơ tìm nhẹ. Tổng số năm 
sống tỉnh hãng C}ALLY của hai ca là 3 năm. Do đó, chỉ phí điểu trị bệnh tỉnh trên 
mỗi QÀ LY là 3535353 (lấy 1000000 chia cho 30 năm). 

3. Hiệu quả kinh tế 

Để so sánh hiệu quả kinh tế và lắm sảng giữa 2 thuật điểu trị hay 2 loại 
thuốc, các nhà nghiên cứu thường sử dụng chỉ số cost uHify ratin hay còn gọi là 
incremental casf-effectiveness (sẽ viết tắt là E}. Chẳng hạn như để so sánh hiệu 
quả kinh tế của ramipril và pÌacehbo (giả dược), CUR cỏ thể ước tính như sau: 

C_-C 


Trang đó, CC nrgd là chỉ phí điểu trị tính trung bình cho mỗi bệnh nhản được 
điều trị bằng ramipril, và C„..„„ là chỉ phí tính trung bình cho nhóm không được 
điều trị, QÁLY mủ Th QALY : „„ 1Ên lượt là chỉ số QALY trong nhóm được điểu 
trị bằng ramipril và nÌacebo. 

Dựa vào công thức này, các nhà nghiên cứu đã ưức tính E cho raminril truong 
điểu kiện kinh tế ở Thụy Điển là 1940 Eura, và kết luận răng ramipril có hiệu quả 
kinh tế cao [4]. Một phản tích khác ở Anh cũng kết luận tương tự [5]. 

Cẩn phải nói thêm rằng trong nhiễu trường hợp, hiệu quả lãm sảng không 
thể mô tả bằng thời gian sống, mà qua xác suất mắc bệnh. Chẳng hạn như thuốc 
chẳng loäng xương, hiệu quả lãm sảng của thuốc là giảm nguy cơ (xác suất} nấy 
xương. Gọi nguy cơ gấy xương mỗi năm của hai nhóm là P và P, (có thể là hai 
loại thuốc). Gọi chỉ phí điểu trị trung vòng một năm của hai thuật điểu trị là C. 
và C.. Hệ số hiệu quả được tính bằng: 

g==—S 
lnh 

Nhưng vì L/(P, — P,} chính là NNT, số bệnh nhân cẩn được điểu trị để ngăn 
ngữửa | ca bệnh. Vì thế, công thức trên còn cỏ thể viết như là một hàm số của 
NNT: 


E=ÍG-—C,)x NNT 
Chủ # trong công thức trên, chúng ta không có hệ số chất lượng sống, mà 
thay vào đó là mức độ khác biệt về nguy cư mắc bệnh giữa hai thuật điều trị. 


- IRö - 


hffps://tieulun.hopto.org 


4. Định giả mạng sẵng con người? 


Câu hỏi đặt ra là trị giá trên mỗi QALY bao nhiêu có thể xem là “có hiệu quả 
kinh tế” (cost-efective)? Theo mỗ hình tỉnh tuần của NICE, nước Anh chỉ có thể 
có khả năng chi 50000 USD cho mỗi QQALY. Bất cử thuốc nào trên giá này được 
xem là thiếu hiệu quả kinh tế. Chẳng hạn như trong trường hợp thuốc kéo đải 
tuổi thọ chỉ 6 tháng (0.5 năm), và với những tác động phụ của thuốc, hệ số hữu 
dụng chỉ khoảng Ũ.6, da đỏ chỉ số của bệnh nhân là QALY = 0.5 x 0.6 = Ö.3. Với 
cải giá 54000 USD, chi phí tính trên QALY là 54000/0.3 = 180000 LISD (tức cao 
hơn mức chỉnh phủ cỏ thể trả). Dựa vào tỉnh toán nảy, chính phủ Ánh cho răng 
chỉ phi để kéo dải tuổi thọ cho bệnh nhân là quá đất. 


Nhưng một số nghiên cứu thực tế ở Mĩ cho thấy 1 QALY có thể trị giá khoảng 
100.000 USD, thậm chỉ 300000 USD. Trị giá này được tính toán dựa vào bệnh 
nhắn suy thận nếu được chạy thận mỗi ngày thì mỗi năm tốn khoảng 70000 USD 
(ở Mĩ). Và mỗi năm sống của bệnh nhân thận cỏ hệ số chất lượng sống khuảng 
ũ.69. Vi thế, tỉnh trên mỗi QALY trị giá QALY ở Mĩ là 70000/0.69 = 101449 USD. 
Tuy nhiên, ngay cả con số này cũng vẫn củn trong vòng tranh luận. 


Đối với các nước đang nhát triển như nước ta, vấn để ứng dụng chỉ số QALY 
cũng có phẩn khỏ khăn, chủ yếu do thu nhập bình quản đấu người còn thấp. 
Ngoài ra, do thiểu nghiên cứu khoa học, nên việc ứng dụng chỉ số QALY ở nước 
ta có thể là một vấn để nan giải. Tuy nhiên, Tổ chức y tế thể giới (W HO) cho rằng 
củ thể dựa vào thu nhập bình quản đấu người sau khi điểu chỉnh cho sức mua 
(còn gọi là PP hay nưurchase power parify) để ấn định trị giá có hiệu quả kính tế 
cho một thuật điểu trị. Theo W HỖ, nếu chỉ nhỉ điểu trị tính trên QALY 

s« thấp hơn FPF thi thuật điểu trị được xem là rất có hiệu quả; 

s bảng hoặc cao nấp 3 lần PPE thuật điểu trị có thể xem là có hiệu quả; 

« hơn 3 lần PPE, thuật điểu trị có thể xem là không có hiệu quả kính tế, 

Theo số liệu kinh tế, thu nhận bình quản đầu người (GDP per capita) đ nước 
ta trong năm 2008 là 1047 USD, và PPP là 2774 USD. Do đó, theo WHD, thuật 
điểu trị hay thuốc có chỉ phí trên mỗi QALY thấp hơn 8322 USD (hay 14.1 triệu 
đồng) có thể xem là “có hiệu quả. Tuy nhiên, cách tỉnh này dựa vào hệ số chất 
lượng sống của người phương Tây. Yếu tổ văn hóa và cảm nhận của người Việt về 
tỉnh trạng sức khỏe cỏ thể rất khác với cảm nhận của người phương Tảy, nhưng 
chúng ta chưa biết những cảm nhận về bệnh tật ở người Việt ra sao. 
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Vài nhận xét 


Quay trở lại câu hỏi mạng sống con người trị giá bao nhiêu, có lễ chúng ta 
nghỉ răng cầu trả lời là “vỏ giá, bởi vi không cỏ gì có thể thay thể mạng sống của 
một con người. Nhưng cũn người chúng ta vẫn hay so sảnh hàng ngày. Công 
nhản chấp nhận những công việc nguy hiểm với một mức lương cao hơn hình 
thưởng. Ngưới giảu sang suy nghĩ răng mạng sống của họ đất hơn mạng sống 
người nghèo khó. Nhu cẩu cho một “thước đo” về cuộc sống là cỏ thật, nhất là 
đứng trên bình diện cá nhãn của người bệnh vá lợi ích cho một quần thể. 

Thước đo đó có thể thể hiện qua chỉ số QALY vẫn được phát triển vào năm 
1872 bởi bác sĩ James Bush (Đại học California, San Diego), nhưng rất ít ai chú 
Ý và ắp dụng. Đến khi chỉ phí y tế lên cao thì QALY mới được ứng dụng rộng 
rãi như hiện nay. Chỉ số QALY có lẽ là một trong những phát triển mới có ảnh 
hưởng lớn đến việc thực hành y khoa và quản lỉ y tế. Lợi thế lớn nhất của QAL Y 
là tổng hợp được hai khia cạnh lượng và chất của một thuật điểu trị, và qua đá 
cung cấp một đơn vị chung để đa lường hiệu quả của các thuật điểu trị khác 
nhau và các bệnh khác nhau. 


Nhưng cũng như bất cứ chỉ số nào, QALY cũng không phải là hoàn hảo. Yếu 
điểm lửn nhất của QALY là thiểu tỉnh nhạy (sensitivity), khi so sánh hai thuật 
điểu trị cho những bệnh không nghiêm trọng. Ngoài ra, đổi với những bệnh 
mãn tỉnh, chất lượng cuộc sống là một khia cạnh quan trọng hơn là thời gian 
sống, và QALY chưa phản ảnh chính xác được hai khia cạnh này. Hiện nay, có 
nhiễu nghiên cứu cho thấy đối với các bệnh mãn tỉnh, cẩn phải có những hệ số 
chất lượng sống cho từng bệnh thi chính xác hơn là hệ số dựa vào EQ-5I. Nói 
chung, QHALY tuy củn củ những khiếm khuyết, nhưng hiện nay đó là chỉ số tốt 
nhất má chúng ta cỏ. 


Tiển hộ trong y khoa đếu kém then một cải giá và đếểu kèm một “mặt tối” 
Phần lớn những tiến hộ y khoa nhằm kéo dài tuổi thọ cho bệnh nhân hay giảm 
nguy cơ tử vong, nguy cữ mắc bệnh, nhưng mặt khác bất cử thuốc hay thuật can 
thiện nảo cũng có những “ảnh hưởng phụ” (tuy gọi là “phụ” nhưng có khi nguy 
hiểm đến mạng sống của bệnh nhân]. Do đó, đánh giả sự tiến bộ trang y khoa 
không chỉ dựa vào chỉ số lãm sảng, mả củn phải tiếp cận vấn để để hiểu những 
lợi và hại, đặc biệt là lợi ích lãm sảng phải được phản tích với chỉ phí. Nguyễn 
lí đằng sau của chỉ số QALY cũng có thể xem là tương đương với tư duy "liệu 
cũm gắn mắm” của người Việt. Trang bối cảnh kinh tế đang nhát triển và nhần 
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lửn dân số ở nước ta vẫn còn trong tình trạng nghèn khả, thiết tưởng QALY cẩn 
được nghiên cứu nhiều hơn nữa ở nước ta để có một phương tiện tốt trong việc 
đi đến quyết định tốt nhất cho bệnh nhẫn và giúp cho các giới chức quản lỉ y tế 
hoạch định những chính sách y tế công bằng và có hiệu quả hơn. 
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BỘ CÂU HỎI EQ-5D SỬ DỤNG “ 
TRONG VIỆC ƯỚC TÍNH HỆ SỐ CHẤT LƯỢNG SỐNG (UTILITY) 


Bộ câu hỏi gắm có 5 khia cạnh phản ảnh sức khỏe thể lực vả tính 
thần: đi đứng (mobility}, đau nhức (pain and discomifort), tự chăm sóc 
(self-care}, lo lắng (anxiety/depression), hoạt động hàng ngày (daily 
actvities). Mỗi câu hỏi có 3 câu trả lời. Tổng cộng có 243 (tức 3 lũy thửa 
5) tỉnh trạng sức khỏe. Thật ra, chỉnh xác là 245 vì còn hai tỉnh trạng khác 
nữa: đỏ là chết và bất tỉnh. Sử dụng số liệu nảy, các nhà nghiên cứu phát 
triển hệ số chất lượng sống. 


se Đi đứng 
1. Không cả vấn để hay khó khăn trong việc đi đứng. 
2. Vải khó khăn trong việc đi đứng. 
3. Không thể đi đứng, phải nằm một chỗ. 
Đau nhức 
1. Không đau nhức. 
2. Đau nhức chút it, cảm thấy khó chịu. 
3. Rất đau nhức vả rất khó chịu. 
Tự chăm súc 
1. Có thể tự chăm sóc mà không có khó khăn nào. 
2. Khả khăn trong việc mặc quấn áo và vệ sinh cá nhắn. 
3. Không cỏ khả năng mặc quản án và vệ sinh cá nhân. 
1. Hoàn toàn vui vẻ, không lo lắng hay trầm cảm. 
2. Bị trầm cảm ở mức độ trung bình. 
3. Rất lo lắng và trẩầm cảm. 
Hoạt động hàng ngày (làm việc, học, làm việc nhà, giải trí) 
1. Không có khó khăn nảo trang các hoạt động hàng ngày. 
2. Vải khỏ khăn trong các hoạt động hàng ngày. 
3. Không có khả năng tự làm những việc hàng ngày. 
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14 
PHÂN TÍ0H TỔNG HỢP 


danh mục “meta-analysis, mả tôi tạm dịch là phản tích tổng hợp. Vậy 

phăn tích tổng hợp là mì, mục đích là gì, và cách tiến hành ra sao là những 
cầu hỏi mà rất nhiễu bạn đọc muốn hiết. Trang chương này tỗi sẽ mỗ tả sơ qua 
vài khải niệm và cách tiến hành một phản tích tổng hợp. 


T rong mẫy năm gắẫn đây, trong y văn xuất hiện khả nhiễu nghiên cửu dưới 


Ông bà ta vẫn thưởng nói “Mật cây làm chẳng nên nan/ Ba cây chụm lại nên 
hàn nải caa” để để cao tính thần hợp lực, đoàn kết nhằm hoàn tất một công việc 
quan trọng cần đến nhiều người. Trong nghiên cứu khoa học nói chung và y 
học nói riêng, nhiều khi chủng ta cẩn phải xem xét nhiễu kết quả nghiên cửu từ 
nhiễu nguấn khác nhau để giải quyết một vấn để cụ thể. 


Nguồn gốc và ý tưởng tổng hợp đữ liệu khởi đầu từ thế ki 17, chứ chẳng phải 
là một ý tưởng mới. Thời đỏ, các nhà thiên văn học nghĩ răng cẩn phải hệ thống 
hóa dữ liệu tử nhiều nguốn để có thể đi đến một quyết định chính xác và hợp li 
hơn các nghiên cứu riêng lẻ. Nhưng phương pháp phản tích tổng hợp hiện đại 
phải nói là bát đầu từ hơn nửa thể kỉ trước trong ngành tâm lí học. Năm 1953, 
nhà tâm lí học trứ danh Hans ]. Eysenck tuyên bố rằng tâm lí trị liệu chẳng có 
hiệu quả gì cả. Hơn hai mươi năm sau, năm 1976, Gene V. Glass, một nhà tâm li 
học người Mĩ, muốn chứng minh rằng Eysenck sai, nên ông tìm cách thu thập 
dữ liệu của hơn 375 nghiên cửu về tâm lí trị liệu trong quá khử, vả tiến hành 
tổng hợp chúng hằng một phương nháp mà ông đặt tên là “meta-analysis” [I]. 
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Qua phương pháp phân tích này, Glass tuyên bổ răng tâm lí trị liệu có hiệu quả 
và miúp ch cho bệnh nhãn. 


Phãn tích tổng hựp - hay meta-analysis - từ đỏ được các bộ môn khoa học 
khác, nhất là y học, ứng dụng để giải quyết các vẫn để như hiệu quả của thuốc 
trong việc điểu trị bệnh nhãn. Cho đến nay, các phương pháp phản tích tổng hợp 
đã phát triển một bước dải, và trở thành một phương pháp chuẩn để thẩm định 
các vấn để gai móc, các vẫn để má sự nhất trí niữa các nhà khoa hạc vẫn chưa đạt 
được. Có người xem phản tích tổng hợp có thể cung cấp một cầu trả lửi sau củng 
cho một câu hỏi y học. Tôi tuy không lạc quan và tí tín như thể, nhưng vẫn cho 
răng phản tích tổng hợp là một phương pháp rất có ích cho chúng ta giải quyết 
những vẫn để củn trong vòng tranh cãi. Phản tích tổng hợp cũng có thể giún chủ 
chúng ta nhận ra những lĩnh vực nào cẩn phải nghiên cứu thêm hay cẩn thêm 
hãng chứng. 

Chúng ta thấy kết quả của mỗi nghiên cứu đơn lẻ thưởng được đánh giả hoặc 
là "tích cực” (tức là, chẳng hạn như, thuật điểu trị có hiệu quả), hoặc là “tiêu cực” 
(tức là thuật điểu trị không có hiệu quả), và sự đánh giá này dựa vào trị số P. 
Thuật ngữ tiếng Anh gọi qui trình đó là “test of signilcance” - kiểm định thống 
kẻ. Nhưng ý nghĩa thẳng kẽ tùy thuộc vào số mẫu được chọn trong nghiên cửu, 
và một kết quả “tiêu cực” không có nghĩa là giả thiết của nghiên cửu sai, mà có 
thể đó là tín hiệu cho thấy số lượng mẫu chưa đẩy đủ để đi đến một kết luận đáng 
tin cậy. Cải logic của nhân tích tổng hợp, do đó, là chuyển hưởng từ signilicance 
testing sang ước tỉnh effect size - mức độ ảnh hưởng. Cầu trả lời mà nhẫn tích 
tổng hựp muốn đưa ra không chỉ đơn giản là có hay không có ý nghĩa thống 
kê (signilcant hay insignilcant} mả là mức độ ảnh hưởng bao nhiêu, có đáng 
để chúng ta quan tắm, có thích hợp để chúng ta ứng dụng vào thực tế lâm sảng 
trong việc chăm sóc bệnh nhằn. 


1. Eixed-eifects và Random-effects 


Hai thuật ngữ má bạn đọc thưởng gặp trong các phần tích tổng hợp là ñixed- 
effects (tạm dịch là ảnh hưởng bất biến) và randam-effects (ảnh hưởng biến 
thiên). Để hiểu hai thuật ngữ nảy tôi sẽ đưa ra một ví dụ tương đổi đơn giản. 
Hãy tưởng tượng chúng ta muốn ước tính chiểu cao của người Việt Nam trong 
độ tuổi trưởng thành (18 tuổi trở lên). Chúng ta có thể tiến hành 100 nghiên 
cứu tại nhiều địa điểm khác nhau trên toàn quốc; mỗi nghiên cửu chọn mẫu 
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(samples) một cách ngẫu nhiên từ 1Ù người đến vải chục ngàn người; và cử mỗi 
nghiên cửu chúng ta tính toán chiếu cao trung bình. Như vậy, chúng ta có 1ũũ 
số trung binh, và chắc chắn những con số này không giếng nhau: một số nghiên 
cửu có chiếu cao trung bình thấp, cao hay... trung bình. Phân tích tổng hợp là 
nhằm mục đích sử dụng 100 số trung bình đó để ước tính chiếu cao cho toàn thể 
người Việt. Có hai cách để ước tỉnh: ñxed-efiects meta-analysis (phản tích tổng 
hợp ảnh hưởng bất biến) và random-effects meta-analysis (nhân tích tổng hợp 
ảnh hưởng hiến thiên) [3]. 

Phân tích tổng hựp ảnh hưởng hất biến xem sự khác biệt giữa 1ŨŨ cũn số 
trung hình đó là do các yếu tổ ngẫu nhiên liên quan đến mỗi nghiễn cứu (còn mọi 
là within-study variance) gãy nên. Cải giả định đăng sau cách nhận thức này là: 
nếu 101 nghiễn cứu đỏ đếu được tiến hành hoàn toàn miống nhau (như có cùng 
số lượng đối tượng, củng độ tuổi, cùng tỉ lệ giới tính, cùng chế độ dinh dưỡng, 
v.v...} thi sẽ không có sự khác biệt giữa các số trung hình. 

Mếu chủng ta gọi số trung bình của 100 nghiên cửu đó là xị, x;,.... xi quan 
điểm của phần tích tổng hợp ảnh hưởng bất biển cho rằng mỗi x, là một biến 
số mồm hai phần: một phần phản ánh số trung hình của toàn bộ quần thể dân 
số (tạm gọi là Äiñ}, và nhân củn lại (khác biệt mữa x, và ÄÍ là một hiến số e,. Nói 
cách khác: 

1, =M +e 


xạ =M te; 


Ta = Â + đàn 
Hay nói chung là: 
",=Mi +, 
Tất nhiên có thể e, < ñ hay £, > Ũ. Nếu M và £, độc lặp với nhau (tức không 


có tương quan gì với nhau} thì phương sai của x, (gọi là var|x,|) có thể viết 
như sau: 


var|x, |= var|Mf |+ var|e, | =0+z; 
Chủ ý var|.M] = 0 vì AM là một hằng số bất biến, zˆ là phương sai của e,. Mục 
đích của phản tích tổng hựp là ưức tỉnh M và x;. 
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Phân tích tổng hợp ảnh hưởng biến thiên xem mức độ khác biệt (còn gọi là 
phương sai) giữa các số trung bình là do hai nhóm yếu tổ gây nên: các yếu tổ liên 
quan đến mỗi nghiên cửu (within-study variance} và các yếu tổ giữa các nghiễn 
cứu (hetween-studly variance}. Các yếu tổ khác biệt giữa các nghiên cứu như địa 
điểm, độ tuổi, giới tính, dinh dưỡng, v.v... cẩn phải được xem xét và nhân tích. 
Nói cách khác, phản tích tổng hợp ảnh hưởng biển thiên đi xa hơn phần tích 
tổng hợp ảnh hưởng bất biến một bước bằng cách xem xét đến những khác biệt 
giữa các nghiên cứu. Do đỏ, kết quả từ phản tích tổng hợp ảnh hưởng biến thiên 
thường “bảo thủ” hơn các nhần tích tổng hợp ảnh hưởng hất hiển. 

Quan điểm của phản tích tổng hợp ảnh hưởng hiến thiên cho rằng mỗi 
nghiên cứu có một giá trị trung bình cả biệt phải tước tính, gợi là m,. Do đó, x, 
là một biển số mắm hai phần: một phần phản ảnh số trung bình của quản thể mả 
mẫu được chọn ( m, , chủ ý ở đây có chỉ từ ¡ để chỉ một nghiên cửu riêng lẻ ¡}, và 
phần củn lại (khác biệt mữa x, và m, là một biến số e, ). Ngoài ra, nhân tích tổng 
hợp ảnh hưởng hiển thiên còn nhát hiểu rằng m, dao động chung quanh số tổng 
trung hình M bằng một biển ngẫu nhiễn z,. Nói cách khác: 

X, =H +, 

Trong đỏ: 

m, = MÍ +œ, 

Thành ra: 

*,= M +e,+ĂẲ, 
Và nhương sai của x, bảy giữ có hai thành nhân: 


var|x, |— var|A |+ var|e, |+ var|e, | 0+ sẺ + s2 

Như ta thấy qua công thức này, z? phản ảnh độ dao động miữa các nghiên cứu 
(hetween-study variaHon), còn øˆ phản ánh độ dao động trong mỗi nghiên cứu 
(within-study variation). Mục đích của phân tích tổng hợp ảnh hưởng hiến thiên 
là ước tính M, s” và z”. 

Mỏi tóm lại, phản tích tổng hợp ảnh hưởng hất biến và phản tích tổng hợp 
ảnh hưởng hiển thiên chỉ khác nhau ở phương sai. Trong khi nhân tích tổng hợp 
hất biển xem zˆ = 0, thì phản tích tổng hợp biến thiên đặt yêu cẩu phải ước tính 
#s. Tất nhiên, nếu 4Ÿ = ñ thì kết quả của hai phân tích này giống nhau. Chúng ta 
sẽ tập trung vào nhương phảp phần tích tổng hợp ảnh hưởng hất hiển. 
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2. Qui trình của một nhân tích tổng hựp 


Cũng như bất cử nghiên cứu nào, một phần tích tổng hựp được tiến hành qua 
các công đoạn như: thu thận dữ liệu, kiểm tra dữ liệu, phản tích dữ liệu, và kiểm 
tra kết quả phân tích. 


Bước thử nhất: tìm công trình nghiên cứu. Sử dụng hệ thống thư viện y khoa 
PuhMed hay một hệ thống thư viện khoa học của chuyên ngành để tìm những 
hải bảo liên quan đến vấn để cần nghiên cửu. Bởi vì có nhiễu nghiên cứu, vĩ li 
do nào đá (như kết quả “tiêu cực” chẳng hạn), không được công hổ, cho nên nhà 
nghiền cứu có khi cũng cẩn phải thêm vào các nghiên cứu đỏ. Những nghiên 
cứu như thể thường được công hổ trong các hội nghị dưới dạng ahbstract (bản 
tôm tắt) trong các hội nghị quốc tế. Do đỏ, nhà nghiên cứu cẩn phải kiểm tra 
ahstract các hội nghị để có thêm thông tin. Có khi nhà nghiên cửu phải liên lạc 
trực tiếp với tác giả để có thêm dữ liệu. Việc làm nảy tuy nói thì dễ, nhưng trong 
thực tế không dễ đàng chút nào! 


Bước thứ hai: rà suát tiêu chuẩn. Trong nước này, nhà nghiên cứu kiểm tra 
trong số các nghiên cứu được truy tìm đó, có bao nhiêu đạt các tiêu chuẩn đã 
được để ra. Các tiêu chuẩn này có thể là đối tượng hệnh nhẫn, tình trạng bệnh, 
độ tuổi, giới tính, tiêu chị, v.v... Chẳng hạn như trong số hàng trăm nghiên cứu 
về ảnh hưởng của viatmin ID đến loäng xương, có thể chỉ vải chục nghiên cửu 
đạt tiêu chuẩn như đỗi tượng phải là phụ nữ sau thời mãn kính, mặt độ xương 
thấp, phải là nghiên cứu lãm sàng đối chứng ngắu nhiễn (randomized cantrolled 
clinical trials - RCT), tiêu chí phải là gãy xương đủi, v.v... Những tiêu chuẩn này 
phải được để ra trước khi tiến hành nghiên cứu. 

Bước thử ba: trích số liệu. Một mẫu thu thận thông tin được thiết kế, và nhà 
nghiền cứu chiết số liệu từ các bải bán khoa học. Sau khi đã xác định được đổi 
tượng nghiên cửu, bước kể tiếp lá phải lên kế hoạch chiết số liệu từ các nghiên 
cửu đó. Chẳng hạn như nếu là các nghiên cứu RCT, nhà nghiên cứu phải tìm cho 
được số liệu cho hai nhóm can thiện và đổi chứng. Có khi các số liêu này không 
được cũng hỗ hay trình hảy trong bài bảo, và trong trưởng hợp đó, nhà nghiên 
cứu phải trực tiếp liền lạc với tác giả để tìm số liệu. 

Bước thử trẻ phân tích thống kẻ. Trong bước này, mục đích là ước tính mức 
độ ảnh hưởng chung cho tất cả nghiên cứu và độ dao động của ảnh hưởng đá. 
Phản tích bias và một số chỉ số liên quan. Cũng như phản tích thống kẻ cho 


-105.- 


tửng nghiên cửu riêng lẻ tùy thuộc vào loại tiêu chí (như là biến số liên tục - 
cantinuous variahles - hay biển số nhị phần - dichotamous variahles), phương 
pháp phản tích tổng hợp cũng tùy thuộc vào các tiêu chí của nghiên cứu. Tỏi sẽ 
giải thích cụ thể cách làm trang chương về phản tích thống kẻ. 

Bước thứ năm: diễn giải kết quả. Sau khi đã có kết quả phân tích, bước sau 
cùng là diễn giải các kết quả đó trong bối cảnh câu hỏi nghiên cứu. Các khia 
cạnh cẩn chú ý là publicatinn hias (tức có xu hướng kết quả tích cực thưởng 
được cũng bố, còn kết quả tiêu cực thì không công bố), mức độ khác biệt giữa 
các nghiên cứu, và mức độ ảnh hưởng của can thiệp. 

Vi dụ 1. Phản tích tổng hợp với biến nhị nhân 

Beta-blocker (sẽ viết tắt là BB) là một loại thuốc có chức năng điểu trị vả 
phòng chống cao huyết áp. Có giả thiết cho răng BB cũng có thể phòng chống 
bệnh suy tim, hay ít ra là làm giảm nguy cơ suy tim. Để thử nghiệm giả thiết này, 
hàng loạt nghiên cứu lãm sàng đổi chứng ngẫu nhiên (RCT) đã được tiến hành 
trong thời gian 20 năm qua. Mỗi nghiên cứu có 2 nhóm bệnh nhắn: nhóm được 
điểu trị bằng BB, và một nhóm không được điểu trị (củn gọi là nlaccho hay giả 
dược}. Trong thửi gian 2 năm theo dõi, các nhà nghiên cứu xem xét tấn số tử 
vong cho từng nhóm. Bảng 1 sau đây tốm lược 3 nghiên cửu trong quả khử. 


Bảng 1. Beta-blocker và bệnh suy tim (congestive heart failure) 
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N: số bệnh nhản nghiên cứu; Tử vong: số bệnh nhân chết trong thời gian 
theo dõi. 


Như chúng ta thấy, một số nghiên cứu có số mẫu khả nhỏ, lại có những 
nghiền cứu với số mẫu gần 4000 người! Câu hỏi đặt ra là tổng hợp các nghiên 
cứu nảy, kết quả có nhất quản hay phù hợp với giả thiết BB làm giảm nguy cơ 
suy tim hay không? 

Để trả lời câu hỏi nảy, việc đấu tiên cẩn phải làm là chọn một thước đo ảnh 
hưởng (effect size - E5). Vì đây là những nghiên cửu RCT có theo đỗi bệnh nhắn, 
nên chúng ta có thể ước tính nguy cơ tử vong cho từng nhóm của mỗi nghiên 
cứu. Mỗi nghiên cửu có hai tỉ lệ: một cho nhóm BB và một cho nhóm placeho. 
Tôi sẽ gọi hai tỉ lệ này là p, và p.. Thước đa để đánh giá mức độ ảnh hưởng của 
thuốc BE là tỉ số nguy cư (risk ratio - RR), và RR có thể được ước tính như sau: 


RR = ¬ đị 
h 
# - K=. =2 
Chẳng hạn như, trong nghiên cứu 1, chúng ta có: 3=” vả 


ũ 
1: ¬ =.24. Như vậy tỉ số nguy cơ cho nghiên cứu 1 là: #& _— =ñ.833. 


Tỉnh toản tương tự cho các nghiên cứu còn lại, và sau cùng có 13 RR. 


Tuy nhiên, chúng ta biết rằng vì RR là tỉ số, không thể cộng tất cả 13 RR để có 
một số trung hình chung. Một cách giải quyết khó khăn này là hoán chuyển RR 
sang đơn vị lngarit, và tỉnh phương sai cho mỗi logRR. Bảng dưới đây trình bảy 
13 lagRR và phương sai. 


(phươn .m | 
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Nhưng vẫn chưa thể tỉnh trung hình layRR, bởi vi mỗi nghiên cửu có cữ mẫu 
khác nhau. Chúng ta biết rằng số cữ mẫu có liên quan mật thiết đến phương 
sai. Nghiên cứu nào có nhiễu đối tượng sẽ có phương sai nhỏ. Chẳng hạn như 
nghiên cửu 1l và 12 có phương sai rất nhỏ (vi số cũ mẫu lớn) so với nghiên cửu 
3. Do đỏ, một trọng số (weipht] phải được tính toản để thể hiện trọng lượng của 
thông tin. Một cách tính trọng số hợp lí nhất là lịph Iăïng sai. Do đỏ, nghiên cửu 
nào có phương sai thấp thì trọng số cao; ngược lại, nghiên cửu có phương sai 
cao thì mức độ đóng góp về thông tin thấp. Trọng số cho mỗi nghiên cửu được 
trinh hảy trung cột 4 của bảng trên. Sau khi đã cỏ logRR vả trọng số, việc tiớc 
tính một chỉ số logRR chung cho toàn bộ 13 nghiên cứu rất đễ dàng, vì có thể 
dùng phương pháp tích số để tính (xem phần phương pháp tính trong Chương 
thống kẻ). 

Kết quả của phản tích tổng hợp thưởng được mỏ tả qua biểu đỗ forest (rửng) 
dưởi đây. Biểu để forest trình bảy RR và khoảng tín cậy 95% cho mỗi nghiên cửu 
hằng con số và đồ thị bar. Chú ý phía dưới cùng có “RE Model” với kết quả 0.68 
(0.61, 0.77) có nghĩa là RR sau cùng (hay trung hình) của l3 nghiễn cứu. Nói 
cách khác, BB giảm nguy cơ tử vong [so với pÌhaccbo]| 32%, và mức độ giảm này 
củ thể dao động trong khoảng 239 đến 39%. Vì khoảng tin cậy 95% không bao 
gắm 1, chúng ta cũng có thể nói, mức độ ảnh hưởng nảy có ý nghĩa thông kẻ. 
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Siudy 1 —— 0.83 [ 0.29, 2.38 ] 
Study # “————mD_ ũ.#9 [ ñ.ữa , &.50 | 
Study 3 —— 1.07 [Ũ.81, 1.88 ] 
Study 4 —————x—— 0.50 [ 0.05, 5.17 ] 
Study 5 ————— 0.65 [ 0.12 , 3.38 | 
Stiudy 6 — Ũ.78 [ 0.57, 1.10 ] 
Study 7 ———+—— 0.73 [0.13 3.83] 
Study 8 E—=— : ð.30 [ 0.14 , 0.83 ] 
Study 8 —— ũ.58 [ 0.23, 1.56 ] 
Study 1ũ : ũ.23[ 0.08, 1.17 ] 
Stludy 11 "- ñ.88 [ 0.58 , 0.82 ] 
Stiudy 12 - 0.67 [ 0.55, 0.82 ] 
Study 13 ——¬ 0.47 [0.21 , 1.06 ] 
RE Modol + ñ.88 [ 0.81, 0.77 | 


ũ.ủ2 ũ.14 1.00 Tr3a 
Relative Ftsk (lag scale] 


Biếu đã farest thể hiện giả trị của RR và khoảng tin cây 95%. 
Các ước tỉnh khoảng tin cậy 85% Cl của RR vượt qua cột mốc Ï 
dược xem là khăng có ý nghĩa thống kẽ. 

Khi cỏ kết quả RR sau cùng, các nhà nghiên cửu củn phải nhẫn tích khả năng 
“publication hias” (xem Chương Bias), hệ số đồng dạng, phản tích từng nhóm 
nhỏ, v.v... Nhưng các phương pháp nảy sẽ được mỗ tả trong Chương thống kẻ. 

Ví dụ 2. Phân tích tổng hợp với biến liền tục 

Thời mian năm viện để điểu trị ở các bệnh nhân đột qui là một tiêu chỉ quan 
trọng trung việc hoạch định chính sách tài chính. Các nhà nghiên cứu muốn 
hiết sự khác biệt về thời man năm viện giữa hai nhóm hệnh viện chuyên khoa 
và bệnh viện đa khoa. Các nhà nghiên cửu ra soát và thu thập số liệu tử 9 
nghiên cứu như sau (xem Bảng 2). Một số nghiên cứu cho thấy thời gian nằm 
viện trung các bệnh viện chuyên khoa ngắn hơn các bệnh viện đa khoa (như 
nghiên cửu 1, 3, 3, 4, 5, 8), một số nghiên cứu khác cho thấy ngược lại (như 
nghiên cứu 7 và 9). Vấn để đặt ra là các số liệu này có phù hựp với giả thiết 
hệnh nhän các bệnh viện chuyên khoa thưởng cỏ thửi gian năm viện ngắn hưữn 
các bệnh viện đa khoa hay không. Chúng ta có thể trả lời câu hỏi nảy qua phân 
tích tổng hựp. 
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Bảng 2. Thời gian nắm bệnh viện của các bệnh nhân đột quị 
trong hai nhóm bệnh viện chuyên khoa và đa khoa 


Chủ thích: Trong bảng này, ¡ là chỉ số chỉ mỗi nghiên cứu, Ï = 1, 2,..., 9. N, và 
N, là số bệnh nhân nghiên cửu cho từng nhóm bệnh viện; LOS, và LOS, (length 
dÍ stay}: thời gian trung bình năm viện (tỉnh bằng ngày), 5D, và 5D: độ lệch 
chuẩn (standard deviation) của thời gian năm viện. 

Mỗi nghiên cứu ước tính một độ ảnh hưởng, hay nói chính xác hơn là khác 
hiệt về thời man năm viện kỉ hiệu, vả tôi sẽ đặt kí hiệu là vỉ miữa hai nhằm hệnh 
viện. Chỉ số ảnh hưởng nảy chỉ đơn giản lả: 

d, =LO5 T— LŨ „ 

Phương sai của di (tôi sẽ kí hiệu là s;) được ước tính bằng một công thức 
chuẩn dựa vào độ lệch chuẩn và số đổi tượng trong từng nghiên cứu. Với mỗi 
nghiền cửu ï (¡ = Ì, 3, 3,..., 9}, chúng ta cỏ: 

(N,-1)SD,+(N„-1)SD,[ 1 1 
Nụ + Nụ — 2 Nụ Nụ, 
Chẳng hạn như với nghiên cứu 1, chúng ta cỏ: 
d =75—S=20 


z 
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vả phương sai của dỈ: Sau khi đã có trọng số, chúng ta có thể tính hiệu số trung bình của 9 nghiên 


x W(64Ÿ`/ 1 I cứu. Dùng R (package “metalor”, xem Chương thống kẻ) sẽ có kết quả như hiểu 
°= Tôn TƯ Ís*=) Sư nG đổ forest dưới đây. 
Tiến tục tính như thể cho các nghiên cứu khác, chúng ta sẽ có hiệu số và 
phương sai cho mỗi nghiên cứu như sau. Nhưng chúng ta không thể tỉnh trung Study 1 “ca -20.00 [ -32 47, -7.53] 
hình cho 9 nghiên cửu, bởi vì phương sai rất khác biệt miữa các nghiên cửu; chúng Study 2 ” -200[ -483, 083] 
ta cẩn một trọng số. Cũng như trường hựp phản tích biến nhị phần, trọng số ở 8tudy 3 - -55.00 [ -82.77 , -47 23 ] 
đây là l/nhường sai. Tỉnh toán cho từng nghiễn cứu chúng ta có bảng dưới đầy. Study 4 ——— -T1.00 [ -85.02, -46 98 ] 
Độ khác biệt về thời gian giữa hai nhóm và trọng số Study 5 _— -400(-12.15, 4.15] 
= Study 6 b- 1.00[ -11ả. 31Z] 
Study 7 ———¬ 11.00 | -8.06, 3006 | 
Sbudy 8 _ -10.00 [ -14.92, -5.08 ] 
Study 9 bản T.00[ -1.73, 1573] 
RE Model — -15.11[-3284, 243] 


„10000 -50.00 ũ 00 5 01 
Mlean DdÏleresce 


Biểu đỗ farest thể hiện giả trị của dĩ và khoảng tin cây 95%. 
Mức dệ ảnh hưởng d ghỉ nhận từ nghiễn cứu 5, 7 và 8 dược xem là 
không có ý nghĩa thống kẽ, vì khoảng tin cây 85% vượt qua cột mốc Ú. 

Kết quả phản tích tổng hợp cho thấy nhóm hệnh viện chuyên khoa có thời 
gian năm viện ngắn hơn các bệnh viện đa khoa khoảng 15 ngày. Nhưng khoảng 
tin cậy 95% cho thấy, bệnh nhân ở bệnh viện chuyên khoa có thể nằm viện lầu 
hưn 2.4 ngày và ngắn hơn 32.6 ngày so với hệnh nhãn ở bệnh viện đa khoa. Điểu 
này cho thấy chúng ta chưa có chứng cử thuyết phục để cho rằng có sự khác biệt 
thật sự về thời gian năm viện giữa hai nhỏm hệnh viện. 

* $ # 

Thực ra, trong y khoa, chúng ta đã có một truyền thống lâu đời về việc duyệt 
xét băng chứng nghiễn cứu (review), duyệt xét kiến thức hiện hành. Nhưng các 
duyệt xét như thế thưởng mang tỉnh định chất (qualitative review), và vì tỉnh 
định chất, chúng ta khó mà biết chính xác được những khác biệt mang tính 
định lượng giữa các nghiên cứu. Phản tích tổng hợp cung cấp cho chủng ta một 
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phương tiện định lượng để hệ thống bằng chứng. Với phân tích tổng hợp, chúng 
ta có cơ hội để: 


s xem xét những nghiễn cửu nào đã được tiến hành để giải quyết vấn để; 
« kết quả của các nghiên cứu đó như thế nào; 

s« hệ thống các tiêu chỉ làm sảng đảng quan tâm; 

s® rả soát những khác biệt về đặc tính giữa các nghiên cửu; 

s« cách thức để tổng hợp kết quả; và 

s« truyền đạt kết quả một cách khoa học. 


Mục đích của phản tích tổng hợp, xin nhắc lại một lắn nữa, là ước tỉnh một 
chỉ số ảnh hưởng trung bình sau khi đã xem xét tất cả kết quả nghiên cứu hiện 
hành. Một kết quả chung như thể giúp chủ chúng ta đi đến một kết luận chỉnh 
xác và đáng tin cậy hơn. 


Hai ví dụ trên đây hi vọng đã giúp ích cho bạn đọc hiểu được “cũ chế” và ý 
nghĩa của một phản tích tổng hựp. Hi vọng bạn đọc có thể tự mình làm một phân 
tích như thể khi đã có dữ liệu. Thực ra, tất cả các tính tuản trên có thể thực hiện 
hãng một phần mềm như Microsoft Excel. Ngoài ra, một số phần mểm chuyên 
môn khác (như R chẳng hạn) cũng có thể tiến hành những phản tích trên. Tôi sẽ 
giải thích phần này trong chương về phương pháp thống kẻ). Các phép tính thật 
đơn giản. Vấn để của phản tích tổng hợp không phải là tính toán, mả là đữ liệu 
đăng sau tỉnh toán. Dữ liệu tử những nghiên cửu có chất lượng thi kết quả nhẫn 
tích tổng hợp mới củ chất lượng và đáng tin cậy. 

Phân tích tổng hợp cũng không phải là không có những khiếm khuyết. Trong 
nghiền cửu người ta có cầu “rắc vào, rắc ra, tức là nếu các đữ liệu được sử dụng 
trong phân tích không cỏ chất lượng cao thì kết quả của phân tích tổng hựp cũng 
chẳng có giá trị khoa học gì. Dao đó, vấn để quan trọng nhất trong phản tích tổng 
hợp là chọn lựa dữ liệu và nghiên cứu để phần tích, vấn để này cần phải được cân 
nhắc cực kì cẩn thận để đảm hảo tính hựp lí và khoa học của kết quả. 
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Đối với các biến số liên tục 


Nhóm T (số mẫu, trung bình, độ lệch 
chuẩn]: nụ; Xụ› su; Í = ], 2, 3,..., & 


Nhóm 2 (số mẫu, trung bình, độ lệch 
chuẩn}: nạ; Xa; %, 


Độ ảnh hưởng (efect size, E5): 
dÌ; = X„y — Xụ 


Phương sai của đ,: 


. = .=.= =—= ma 


= Rụ +R„ —2 Hy Tu 


Sai số (standard error} của đ,: 


= + 
S¿ —=alS 


Ước số ảnh hưởng chung: 
k h 

d=Ð Wad,!2.W, 
P P 

Phương sai của rỉ: 


Lì 
#ˆ°=1/3 
¿= 


Tóm tắt kĩ thuật về phản tích tổng hựp 


Bãi với các hiến số nhị nhân 


| Nhám l1 (sẽ mẫu, số sự kiện): 
¡ Hụ› Xuii = Ì, 2, _- 


Nhâm 2 (số mắn, sổ sự kiện} 


Hị ãnh lường (etfEet sie, E5} tính. 
bằng tỉ số nguy cơ RR: 


Biến chuyển sang logarithm: 


_6,=log(RR,) 


Phương sai của Ø: 
# 
#h=l12 
#=l 
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Khoảng tin cậy 95%: 
d+1.96xxÍsˆ 


Index of homogeneity: 
k 
0=3_W.(d,—-d} 
„mã 


Index of heteropeneity: 


p_Ø0-(—Ù 


Q 


Xem xét puhlicatian bias: Phân tích 
hãi qui tuyển tính: d = a + b*N .(N là 
tổng số mẫu của nghiền cứu ¡). Xem 
Ý nghĩa thống kê của b. 


Ước tính phương sai giữa các nghiên 


cứu (between-study variance): 


Khoảng tin cậy 951%: 


Ø+1.96x+sˆ 


| Index of hoamaogeneity: 


0=`W(0~6Ÿ 


_ Index of heterogeneity: 


_Ø-(#-I 
lê 


' Xem xét puhlication bias: Phản tích 


hồi qui tuyến tỉnh: ¿ = a + b*N, (N là 
tổng số mẫu của nghiên cứu ¡). Xem 
ý nghĩa thống kê của b. 


' Ước tỉnh phương sai giữa các nghiên 


cứu (between-study variance): 
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15 
THỰC HÀNH Y HỌC THỰC CHUNG 


ác sĩ đổi phỏ với các vấn để lãm sảng lúc nản cũng gặp phải nhiều vẫn 

để đa dạng, có khi rất khó khăn. Tuy đa dạng nhưng thực hành lắm sảng 

trung mi lĩnh vực y học đểu có một mẫu số chung: đỏ là sử dụng những 
hãng chứng tốt nhất cho việc chẩn đoán, phòng ngửa, và điểu trị bệnh tật. Có thể 
xem xét một số trường hợp mang tỉnh giả thuyết nhưng cũng khá tiêu biểu sau 
đây để mình họa cho vấn để: 


« Trường hợp l1: Bạn là một bác sĩ đa khoa, đang khám bệnh một bệnh 
nhân nam, 72 tuổi, không có triệu chứng gì đáng chú ý, và bệnh nhân 
muỗn biết ông có nên tham gia vào một chương trình tắm soát ung thư 
ruột hay không. Bạn sẽ nói gì với bệnh nhắn? 

« Trường hợp 2: Bạn là một bác sĩ chuyên khoa thận, và bệnh nhân của 
bạn là một người đản ông 5Ũ tuổi với chứng suy thận vì viễm thận tiểu 
cầu (glamerulonephrits). Bạn có nên điểu trị bệnh nhản bằng thuốc 
cyclnsnorin Ä hay không? 

« Trường hựp 3: Bạn là một bác sĩ ngoại khoa. Bạn có nên sử dụng thuốc 
kháng sinh để phòng chống nhiễm trùng huyết? 

Để trả lời các câu hỏi trên, thông tin đồng một vai trỏ cực kì quan trọng, nhất 
là các bằng chứng nghiên cửu liên quan đến câu hỏi lãm sảng đặt ra. Nhưng 
thông tin được tích lũy theo thời gian. Một câu trả lời hôm nay có thể sẽ thay đổi 
trong vùng 5 năm tới, cũng như hãng chứng nghiên cứu đã từng thay đổi trang 
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vòng 5 năm qua [1-4]. Dao đó, cái thử thách quan trọng nhất là làm thể nào để 
cập nhật húa thông tin y học và khoa học, và ứng dụng những thông tin này vào 
quyết định y khoa. Đây chỉnh là một “địa hạt” của y học thực chứng. 


Trang một cuộc điểu tra trên 635 phòng mạch và 1ŨÙ giáo sư ở Mĩ, nẩn 2/3 
bác sĩ cho biết lượng thông tin ngày nay quả lớn và sầu rộng đến nỗi họ không 
củ khả năng quản lí một cách hữu hiệu [4|. Khi các nhà nghiền cứu hỏi các bác 
sỉ về những tiến bộ quan trọng gẵn đây trong y học, họ phát hiện rằng gẵẩn 2/3 
hác sĩ có sự hụt hãng về kiến thức, và sự hụt hằng có thể ảnh hưởng đến chất 
lượng chăm sóc bệnh nhân. Tỉnh từ năm 1989, khi công trình nghiên cứu trên 
được công hỗ, kiến thức y khoa đã tăng vọt khoảng 509 [5]. Y học thực chứng 
cỏ thể cung cấp cho các bác sĩ phương tiện để truy tìm, thẩm định và ứng dụng 
thông tin hay bằng chứng nghiên cứu tốt hơn [6]. Phương tiện này chẳng những 
rất cẩn thiết cho các bác sĩ má củn có ích cho bệnh nhắn và giới chức quản lí y 
tế. Trong chương nảy tôi sẽ tập trung vào việc ứng dụng y học thực chứng trong 
việc miúp cho bác sĩ đi đến một quyết định lãm sảng. 

Trong một nghiên cứu ở Úc, các nhà nghiên cứu phát hiện rằng các bác sĩ 
không có đủ thời gian (74%), không có kĩ năng tìm thông tin (419) và hạn chế 
trong việc truy cặp thông tin (43) là những khó khăn trong việc sử dụng các 
dữ liệu nghiên cứu [7]. Công trình nghiên cửu trên còn phát hiện răng để ng 
dụng y học thực chứng vào việc chăm sóc bệnh nhãn một cách hữu hiệu, hai 
điểu cắn phải giải quyết: huấn luyện về y học thực chứng, vả phát triển một hệ 
thống chuyển giao thẳng tin y khoa đến việc quyết định lãm sảng. Qui trình của 
y học thực chứng có thể tóm lược bằng 4 bước sau đây: 

s đặt cầu hỏi thực tế; 

s truy cập thông tin liên quan; 

s« thẩm định giá trị khoa học và khả năng ứng dụng của thông tin; và 

s« ng dụng thông tin vào việc chăm sóc bệnh nhắn. 


1. Đặt câu hỏi thực tế 

Khiêm tốn về những gi mình biết. Trong thời đại bùng nỗ liên tục về tri 
thức y khoa, chúng ta phải giả định rằng bất cứ một phát biểu mang tính khẳng 
định nào cũng đểu nguy hiểm. Dao đó, chúng ta phải chấp nhận một thực tế là 
kiến thức y khoa không hao giữ cổ định, mà vẫn tiến hỏa liên tục. Các nghiễn 
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cứu về nhu cẩu thông tin cho thấy cử mỗi lấn tiếp xúc với một bệnh nhần ngoại 
trủ có Ít nhất là I hay 2 câu hỏi được đặt ra; và cử mỗi bệnh nhắn nội trủ thì có 
it nhất 5 câu hỏi được đặt ra [8-9]. Khoảng 1/3 những câu hỏi nảy thường liên 
quan đến việc điểu trị cha một bệnh cụ thể, và 1/4 liên quan đến chẩn đoán [ lũ]. 
Y học thực chứng cỏ thể giúp cho chúng ta trả lời những cầu hỏi liên quan đến 
lãm sảng [11]. Phần còn lại gốm các câu hỏi liên quan đến quả trình nhát triển 
hệnh tật và yếu tổ nguy cơ, tức những cầu hỏi kiểu Tại sao xảy ra và Nguyên nhân 
là gỉ, và câu trả lửi cha một phần nhỏ các cầu hỏi loại này có thể tìm trong các 
sách giáo khoa, nhưng y học thực chứng có thể cung cấp cầu trả lời cho phần lớn 
những cẫu hỏi khác. 


Đặt câu hỏi cụ thể. Một khi đã nhận ra câu hỏi lắm sảng, hước kế tiếp là 
chúng ta phải đặt nó vào dạng có thể truy tìm được và có thể trả lời được. Nói 
cách khác, câu hỏi đặt ra phải rất cụ thể, không nên chung chung. Để đạt yêu cẩu 
này, chúng ta cẩn chú ý đến 4 khía cạnh sau đây: 

« quấn thể mả cầu hỏi lãm sàng có thể áp dụng; 

s can thiệp (thuật điểu trị) hay yếu tổ nguy cơ; 

s so sảnh giữa các thuật điểu trị / can thiện hay yếu tố nguy cơ; và 

« tiêu chí lâm sàng [11]. 


Xin nhấn mạnh những cầu hỏi đỏ phải rất cụ thể, và nên tận trung vào cá 
nhân hệnh nhãn hay kết quả lắm sảng, hơn là dựa vào các kết quả giản tiển mà 
không hẳn có liên quan đến tình trạng của bệnh nhân [12]. 

Chẳng hạn như đổi với câu hỏi mà người bệnh 72 tuổi đặt ra (có nên tham 
gia vàn chương trình truy tìm ung thư ruột hay không) chúng ta có thể diễn 
đạt như sau: “Ở những bệnh nhản không triệu chứng với nguy cơ mắc bệnh 
ung thư ruột ở mức trung hình (quản thể), chương trình truy tìm ung thư ruột 
hãng phương pháp xét nghiệm mu trang phản (can thiện) có thể làm giảm tỉ lệ 
tử vong từ ung thư ruột (Hiểu chỉ lãm sảng] so với những người không được xét 
nghiệm (so sảnh) hay không?” 

Nguyên nhân, yếu tổ tiên đoán, chẩn đoán hay can thiệp? Một câu hỏi lâm 
sàng cỏ thể năm một trong bốn khia cạnh: nguyên nhắn của bệnh, yếu tổ nguy 
cơ để tiên đoán bệnh, độ chỉnh xác của phương pháp chẩn đoán, và hiệu quả 
thuật điểu trị. Đỏ là những vấn để má hệnh nhắn và giới quản Ïỉ y tế thường hỏi: 


- —ữa - 


Tại sao tôi mắc bệnh? (nguyên nhân), Làm sao biết tôi mắc bệnh? (chẩn đoán), 
Rỗi điều dì sẽ xảy ra cha tải? (yếu tổ tiên đoán), và Điểu trị có hiệu quả hay không? 
(can thiện). Vĩ dụ cho các cầu hỏi loại này có thể mình họa trang Bảng Ì sau đầy. 
Bởi vi phần lớn những câu hỏi mà bệnh nhân đặt ra thưởng liên quan đến can 
thiệp, chúng ta sẽ bản về vấn để này chỉ tiết hơn. 
Bảng 1: Cách đặt câu hỏi lâm sảng củ thể trả lời được, 
tìm thông tỉn, và cách truy tìm thông tín 


Ở các bệnh nhân 
với tĩnh mạch 
tầm 
(central venous lines] 


tử vong | Có làm giảm nguy cử 
nhiễm trùng 


thư ruột 
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¬ũ với các bệnh nhần 
dụng nội soi : sử dụng ống thông 
col0ninscnpy đường tiểu (catheters] 


Nghiễn cứu lắm sảng 
đổi chứng ngẫu nhiên 


Nghiên cứu 
Cắt ngang 
tiêu biểu 
một thửi 

điểm (cross- 
sectinnal 

study) 


Từ khỏa 
để truy 
tim trang 
MEDLINE 


Clinical trial.pt iÍ no hits with 


Sensitivity.tw Randomised controlled trial.pt 


tw (là tử dùng để truy tìm ["risk.tw” có nghĩa là tìm từ “risk” trong tựa để 
của/hay abstract]); pL (publication type hay loại bài báo [”clinical triaLpt” có 
nghĩa là tìm các hải bảo nghiên cửu lắm sàng tức clinical trials |). 
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2. Truy tìm thông tin 


Phân tích tổng hựp tử các nghiên cửu cơ sử: Thông tin Ìí tưởng nhất là 
những thông tin thích hợp (tức hàm chứa dữ liệu có chất lượng can), mang tính 
liên quan (tức có thể ứng dụng vào mỗi trưởng lãm sảng), đẩy đủ (tức dữ liệu về 
ích lợi và tác hại của can thiệp được mô tả đẩy đủ), và dễ hiểu. 


Quả trình phát triển y học thực chứng trong thời gian gẵẩn đây đã cung cấp 
cho chúng ta nhiễu nguồn thông tin có ích (xem Bảng 2), và việc truy nhập 
thông tin cũng cảng ngày cảng dễ dàng hơn (Chương 3 và Bảng 3). Dữ liệu 
tử các nghiên cửu cơ sử cỏ thể tổng hựnp một cách có hệ thống, và phát triển 
thành những phác độ điểu trị hay hướng dẫn lãm sảng (clinical guideline). Đối 
với những cầu hỏi liên quan đến can thiệp hay điểu trị, các phăn tích tổng hợp 
thưởng kết hợp các dữ liệu tử các nghiên cứu lãm sàng đổi chứng ngẫu nhiên 
(RCT). Bởi vi đối với một vấn để lãm sảng, có thể có nhiễu cách can thiệp khác 
nhau, các phản tích tổng hợp thưởng làm nền tảng cho việc soạn thảo các phác 
độ điểu trị. Các chỉ dẫn nảy, các phác độ điểu trị này nên bao gốm những thông 
tin liên quan đến chẩn đoán, và yếu tổ tên đoán để cá nhân hóa việc điểu trị 
dựa vàn mức độ nghiễm trọng của bệnh [13]. Các nhác độ điểu trị và nhãn tích 
tổng hựp có thể là những “sản phẩm” độc lặp, hay thông thưởng là những bảng 
trích yếu. 


Nghiên cửu cơ sử (primary research) - nêu chưa có phân tích tổng hợp: Khi 
các phân tích tổng hợp chưa có, các phác độ điểu trị vẫn chưa thể xem là khoa 
học (vi thiểu bằng chứng], và bác sĩ cần phải truy tìm dữ liệu từ những nghiên 
cứu cơ sử. Mặc dù dữ liệu tử các nghiên cứu lầm sảng ngẫu nhiên đổi chứng 
được xem là băng chứng có giả trị khoa học cao nhất để thẩm định những thuật 
điểu trị, các bằng chứng tử những nghiên cứu nảy không phải là bằng chứng tốt 
nhất để đánh giả sự chỉnh xác của các nhương pháp xét nghiệm. 
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Bảng 3. Thang bậc bằng chứng và nghiên cứu 


Các bảng | - Rãt đẩy đủ: tám lược tắt cả các - Có thể khỏ sử dụng nếu 
hưởng dẫn nghiên cứu liên quan và các không được trình bảy rõ 
dựa vàn thuật điểu trị cho các bệnh thông rảng vả gọn gảng. 
bằng chứng | ` thường. - Khó cập nhật hóa, có thể trở 
(Evidence- | - Thông tin mang tính ng dụng thánh lỗi thửi rất nhanh. 
based cao, khai thác cần bằng giữa lợi 
guideline] Ích va tác hại cho các nhóm bệnh 

nhãn. 


Phăn tích - Khả toàn điện, tỏm lược các - Chỉ xem xét một trang nhiễu 
tổng hợp thông tin liên quan về một thuật thuật điểu trị cho một bệnh. 


(Swsiematic | - điểu trị. - Thưởng không đấy đủ dũ liệu 
review} - Sai số ngẫu nhiên thấn, có khả về tác hại. 
năng phát hiện các ảnh hưởng - Cung cấp ít thông tin để tiéc 
khiêm tốn. lượng nguy cơ cho tửng bệnh 
- Thẳng tin mang tỉnh ng dụng nhắn. 
cao, phân tích độ đao động của 
tác dụng thuốc chủ từng nhóm 
|_ bệnh nhản 
Các nghiên | - Thông tin cụ thể cho một bệnh. - Không đầy đủ, vì chỉ tận 
trung ván một nghiên cứu 
duy nhất. 
- Thiếu khả năng ứng dụng vào 
các trưởng hợp lắm sảng. 


Bảng 3. Vải nguồn bằng chứng và bảng chỉ dẫn lãm sảng 
Băng chứng lãm sảng: Trích yếu các băng chứng nghiên cửu từ tập san BM] 
Địa chỉ: https://ebm.bmJ.cam 
vả: 


www.nnchi.nÌm.n1h.gov/pmc/?term=1u22BM]+Clinical+EvidenceM⁄22145 
B]ournal5ID 
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Thư viện Cochrane: Trích yếu các phân tích tổng hợp và nghiên cứu lãm sảng 
đổi chứng ngẫu nhiên (RCT} 


Bịa chỉ: https://www.cochranelihrary.com 
MEDLINE: Trích yếu từ các nghiên cứu đã công bố trên các tận san y khoa 
Đặm chỉ: https://www.nchi.nim.nih.gov/pubmed 


Tập san của hiện hội y khoa Mĩ ([AMA): Evidenre-hasedl meilicine: huw tú 
pracHrce and teach EBM [6]. Tài liệu và sách hướng dẫn. 


Địa chỉ: https://]amaevidence.mhmedical.com 


3. Đánh giá chất lượng và tính liên quan lâm sàng 

Sau khi đã tìm được nghiên cứu chính có liên quan đến câu hỏi lãm sảng, 
người sử dụng cẩn phải thẩm định những thông tin tử công trình nghiên cửu 
một cách nghiêm chỉnh. Một hài báo khi được công bã không hẳn có nghĩa là 
củ chất lượng cao. Trang thực tế, các nghiên cứu kém chất lượng thưởng có xu 
hưởng đánh giả quá cao lợi ích của can thiện khoảng 30% [15], tức là đủ để biến 
một can thiệp vỗ dụng trở thành có ích! Tương tự, các nghiên cứu về chẩn đoán 
và xét nghiệm có chất lượng thấp thưởng đánh giá cao sự chính xác của phương 
pháp xét nghiệm [1ö]. 

Một số "công cụ” có thể sử dụng cho việc thẩm định thông tin đã được phát 
triển. Dưới đây là ba câu hỏi hay tiêu chí mà Hội đồng nghiên cứu y khoa và y 
tế quốc gia (NHMRC) của Úc sử dụng thưởng xuyên ([17-18], xem Bảng 3, 4). 

«Bảng chứng thuyết nhục cũ nào? 

s_ Độ ảnh hưởng (effect size} của can thiện lớn ra sao? 

«Ảnh hưởng hay tác dụng đỏ có thể đem lại khác biệt cho bệnh nhân không? 

Mức độ thuyết phục của bảng chứng bao gốm sự thích hợp của mỗ hình 
nghiên cứu (study design), chất lượng của việc thu thập và xử lí thông tin (chẳng 
hạn như nghiên cửu cỏ khách quan không?) và độ chỉnh xác thẳng lẻ của nghiên 
cứu (như kết quả quan sát được có thật sự là da ảnh hưởng của can thiệp hay 
do các yếu tổ ngẫu nhiên và bias). Chỉ cẩn một phút đồng hỗ đọc lướt qua bảng 
tóm lược (abstract] của nghiên cứu, chúng ta cũng có thể đánh giá chất lượng 
của công trình nghiên cửu (và có xửng đảng để chúng ta tiêu thì mử ra đọc hay 
không) qua ba câu hỏi trên. 
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Mếu đọc lướt qua lần đẩu cho thấy kết quả của nghiên cứu có vẻ quan trọng 
và đảng tin cậy, chúng ta sẽ phải sử dụng các phương tiện khác để thẩm định 
phần phương pháp nghiên cứu để biết các nhà nghiên cứu đã tiến hành như thể 
nào (chứ không phải tìm hiểu xem họ sử dụng phương pháp thống kẻ nảo) và 
xem phần kết quả, nhất là các bảng thống kê số liệu và biểu đã. Nhiều chuyên 
gia khuyến cáo và tôi đồng ý là khí đạc một bài hảo y học, nên hắt đầu tử phẩn 
phưng pháp và các bằng biểu, khẳng bao giữ đục nhần kết luận của tắc giả. 


Bảng 4. Các tiêu chí cho việc thẩm định bằng chứng nghiên cửu 


- Thứ bặc bằng chứng Có phải nghiễn cứu được thiết kế một cách tối tu? 
(Bảng 1} 


- Chất lưgng bằng chứng Báo cáo về chỉ tiết của thiết kế nghiên cứu rõ rằng 
hay không? (Bảng 4) 


- Hộ chính xác thống kẻ Trị số P là bạo nhiễu? Khoảng tin cậy 95 rộng 
hay hẹp? (Mức độ bất định của ảnh hưởng thuật 
điểu trị như thể não?) 


- Mức độ ảnh hưởng Mức độ ảnh hưởng của thuật điểu trị ra sao? 


- sự liên quan của ảnh hưởng | Tiểu chỉ của nghiên cứu có quan trọng đổi với 
bệnh nhãn hay không? 


Các tiêu chí này được dựa vào tài liệu của NHMIRC [18]. 


4. Ứng dụng bằng chứng vào quyết định lâm sàng 

Một khi thông tin đã cỏ và được thẩm định nghiêm chỉnh, hước cuối cùng 
là ứng dụng thông tin vào quyết định lãm sàng. Để xác định xem kết quả của 
nghiền cứu cỏ thể ứng dụng vào một bệnh nhãn cả biệt hay không, chúng ta cẩn 
phải so sánh những đặc điểm lắm sảng của bệnh nhân với những đặc điểm của 
các bệnh nhân má công trình nghiên cứu dựa vào. Phương pháp tiếp cận này cỏ 
thể dẫn đến việc điểu trị vải bệnh nhân mả tác hại có khi lớn hơn lợi ích [19]. 
Một cách tiến cận khác có thể tránh tình huống nảy [30 |. Nhưng nói chung, các 
hước sau đây thưởng rất có ích cho việc ửng dụng thông tin. 
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Lập một bảng quyết toản về lợi và hại của thuật điểu trị (can thiệp). Tất cả 
kết quả của một can thiệp (dù lợi hay hại) đếu có thể ảnh hưởng quan trạng đến 
bệnh nhân, và cần phải được xem xét, cân nhắc cẩn thận. Chẳng hạn như đối với 
trưởng hợp 2 (bệnh nhắn suy thận), chúng ta cẩn phải xem xét các lợi ích của 
thuốc cvclosporin Á (có khả năng làm giảm nhu cẩu lạc thận) cùng với các tác 
hại (cao huyết áp, chứng tăng lông tóc, và chứng nhi đại). 


Tử dữ liệu nghiên cửu, ước lượng khả năng lợi ích và tác hại. Cầu hỏi cần 
đặt ra là những lợi ích và tác hại sẽ ảnh hưởng đến bệnh nhân như thể nào? Để 
ước lượng, chúng ta cần phải biết mức độ ảnh hưởng trung bình của can thiệp 
tử các nhần tích tổng hợp (hay các nghiên cứu RCT; nếu chưa cỏ phẫn tích tổng 
hợp) và ảnh hưởng này có khác nhau giữa các bệnh nhân hay tùy thuộc vào các 
yếu tổ nguy cơ của bệnh nhãn hay không. Loại thông tin nảy có thể trích ra từ 
những nhân tích theo từng nhóm (suhbgroup analysis) thưởng được trình hảy 
trong các nhân tích tổng hợp hay các cũng trình nghiên cứu lớn với nhiều bệnh 
nhắn. Cách mỏ tả lợi ích và tác hại của một thuật điểu trị là chỉ số nguy cơ tương 
đổi (risk ratio), hay tốt hơn nữa là số bệnh nhân cần điểu trị (NNTT) mả tôi đã 
mỗ tả trang Chương 5. 


Mếu một công trình nghiên cứu về cyclosporin Ä trong việc điểu trị bệnh 
suy thận cho thấy chỉ số nguy cơ tương đối cho nhu cẩu lọc thận là 0.4 (nói cách 
khác, tỉ lệ cẩn lọc thận trong nhóm được điểu trị bảng 40% tỉ lệ lạc thận trang 
nhóm không được điểu trị), nhưng nếu công trình nghiên cứu quả nhỏ (tức ít 
bệnh nhắn) nên không thể trả lời được câu hỏi chỉ số nguy cơ cỏ thay đổi then 
tửng nhóm bệnh nhân hay không. 

Xem xét đến đặc tính lâm sảng của bệnh nhân. Nếu tỉ số nguy cơ về lợi ích 
của thuật điểu trị độc lặp với độ phơi nhiễm của yếu tế nguy cơ, thi những hệnh 
nhắn có nguy cơ cao nhất sẽ là những người được hưởng nhiểu lợi ích nhất của 
thuật, và những người cỏ nguy cơ thắn nhất sẽ không hưởng gì nhiều từ lợi ích 
của can thiệp. Lợi và hại của một thuật có thể mô tả bằng các chỉ số tuyệt đối 
(như lợi ích bao nhiêu) hay các chỉ số tương đổi (từ các phản tích tổng hợp). 
Bảng 5 cung cấp một vỉ dụ về việc so sánh tỉ lệ lạc thận trong nhóm hệnh nhän 
được điều trị bằng cyclosporin À và nhỏm đổi chứng. 
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Bảng 5. Các tiêu chí về chất lượng cho các loại nghiên cứu lầm sảng 


= Phương pháp truy tim tải liệu cho nhần tích có đẩy đủ và rõ ràng hay không? 
s_ Các nghiên cửu trong nhân tích tổng hợp có được thẩm định chất lượng hay không? 
«Các đặc điểm lãm sảng vả kết quả của các nghiên cửu được tóm lược thích hợp? 
= Những khác biệt giữa các nghiên cửu có được gi thích rõ —.4 
= Phương pháp truy tim tải I liệu cho nhần tích có đẩy đủ và rõ rằng hay không? 
Các phương pháp can thiệp và điểu trị cũng như tiêu chỉ đã được xem xét về tác 
dụng vả tác hại? 
Các để nghị trong bảng chỉ dẫn có được dựa vào thang bậc và chất lượng bằng chứng? 
Các để nghị trong bảng chỉ dẫn có cản bằng giữa lợi ích và tác hại, hay khai thác 
mức độ ảnh hưởng theo tửng nhóm hệnh nhẫn? 


=. Hai nhóm điểu trị (treatrent)] và đổi chứng (nlaceho) có được giữ kín từ những 


người cỏ trách nhiệm tuyển mộ đối tượng nghiên cửu? 
Có phải tất cả các đối tượng tham gia nghiên cứu đều được phần tích? 


Việc đánh giả các tiêu chỉ lắm sàng được tiễn hành một cách khách quan? 
Các nghiên cứu tiêu biểu tại một thửi điểm (Cross-sectional study]} 
liên quan đến yếu tổ nguy cơ và chấn đuản | 

s®  Phươngphápthửnghiệm được so sánh với một phương nhảp chuẩn (pold standard)? 
s® Phương nháp thử nghiệm và phương nhản chuẩn được đo lưững một cách độc lặp? 
s Cách tuyển chọn bệnh nhãn thích hợp? 
= Các đối tượng nghiên cứu được chọn có đại điện cho các bệnh nhắn trong dẫn số 

hay không? 
s_ Thời gian theo dõi bệnh nhân đủ để đánh giá độ chính xác của nhương phán xét 

nghiệm? 
«Các yếu tổ tiên đoản bệnh đã được phần tích? 


Các tiêu chỉ này được dựa vào tài liệu của NHMIRC [17, 18]. 
Do đó, dủ các dữ liệu từ các nghiên cứu lắm sảng ngắu nhiên đổi chứng là rất 
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cần thiết, chúng ta cũng cẩn cả những dữ liệu về ảnh hưởng của các yếu tổ nguy 
cơ mả không được điểu trị (tức nhóm đổi chứng từ các nghiên cứu dịch tế học) 
để ước tỉnh lợi ích tuyệt đối của một thuật điểu trị cho một bệnh nhàn. 

Quay lại với vỉ dụ, số liệu về chức năng thận, huyết áp, và độ protein niệu cho 
thấy bệnh nhän thuộc vào nhóm bệnh nhãn có nguy cơ thấp, xác suất cẩn thiết 
lạc thận trong vòng vài năm tới là khoảng 10%, và có thể giảm xuống còn 43⁄4 nếu 
được điểu trị [20]. Một dữ liệu logic tương tự cũng có thể sử dụng để ước tỉnh 
tác hại của thuật điểu trị. 

Xác định lợi cao hơn hại. Sau khi đã liệt kẻ tất cả lợi và hại của can thiện vá 
xác suất xảy ra cho từng khả năng dựa vào các số liệu nghiên cứu, hước kế tiếp 
là xác định xem lợi ích có thật sự cao hơn tác hại cho bệnh nhắn. Nếu lợi ích 
và tác hại ngang nhau (chẳng hạn như khi xem xét lợi ích và tác hại của thuốc 
thromhodlytic therapy cho điều trị bệnh nhối mắu cơ tìm, chúng ta có thể xem 
xét số tử vong có thể ngắn ngửa được (từ bệnh nhi máu cử tim} bằng với số tử 
vong do xuất huyết não - cả hai đếu là những tác hại nguy hiểm. Nhưng không 
phải ảnh hưởng nào cũng tương đương nhau. Phòng chống tai biến mạch máu 
não bảng aspirin so với chứng chảy máu dạ dày do aspirin gây ra? Những kết quả 
này có thể đo lưỡng bằng con số, và bệnh nhân là người quyết định. 


Bảng 6. So sánh những ảnh hưởng của cyclosporin giữa 2 nhóm bệnh nhân 
lọc thận trong vùng 2 năm (với điểu kiện tỉ số nguy cứ là 60%) 


Số bệnh nhân 

Nhóm bệnh nhân được |. | cẩm lạc thận có thể 
: giảm cho mỗi 100 

ngư được điểu trị 


Nguy cơ thắp 


Tỉnh trạng thận bình thưởng, 
protein-niệu hình thưởng, 
huyết án bình thưởng 

Nguy cư can 

Tỉnh trạng thần bất bình 
thưởng, nrotein-niệu tăng 


cao, và cao huyết án 
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5. Y học thực chứng có cải tiến chất lượng điều trị? 


Các nghiên cửu quan sát (nhservational studies) cho thấy các thuật điểu trị 
đã được “chứng minh” có hiệu quả trong các nghiên cứu RCT và phần tích tổng 
hợp có thể có hiệu quả trang việc chăm sóc bệnh nhãn ở một quần thể lớn trong 
dẫn số [21-23]. Tuy nhiên, người ta vẫn chưa biết nhương phán can thiện nào có 
hiệu quả nhất để giúp cho bác sĩ sử dụng thông tin cho việc quyết định lãm sảng 
[24-26]. Các phác đỗ điểu trị, ý kiến của các chuyên gia có uy tín đã được chứng 
minh là có thể cải tiến chất lượng chăm sóc bệnh nhắn, nhưng các “chiến lược” 
thụ động như hội nghị hay các bản tin không có hiệu quả nào đáng kể. 


6. Tương lai của y học thực chứng 


Thông tin. Vì thứi gian hạn hẹp, bác sĩ không thể nào truy cập được hay 
thẩm định thông tin ngay tại thời điểm tiến xúc với bệnh nhân, thể nhưng đỏ 
lại chính là tỉnh huống thực tế của các bác sĩ đa khoa. Do đá, trình bảy thông 
tin sao cho rõ rằng và đơn giản (như liệt kẽ lợi và hại của tất cả các thuật điểu trị 
hay can thiện) với chỉ tiết về đặc tính lãm sảng để bác sĩ có thể sử dụng đễ đàng 
trong việc điểu trị bệnh nhãn. Trong thực tế, ở Mĩ đã có nhiều hưởng dẫn như 
thể được soạn thảo cho ung thư vú (da Trung tắm Quốc gia về Ling thư [13]), và 
củ thể tải về từ mạng. 


Dữ liệu nghiên cứu thưởng rất phức tạp và có khi cẩn nhiều tỉnh toản. Dao đỏ, 
việc sử dụng các bảng chứng và thông tin có chất lượng cao đôi hỏi đến các hệ 
thống phẩn mềm quản lỉ thông tin bảng máy tính. Một hệ thống như thể cũng 
đã được phát triển đặc biệt cho giới bác sĩ [26-28]. Vai trỏ của bác sĩ là sử dụng 
thông tin và kết hợp với kính nghiệm của mình để đi đến một quyết định hay lời 
khuyên tối ưu cho bệnh nhắn. 


Nghiên cứu y học. Y học thực chứng dựa vào nghiên cứu y học chất lượng 
cau. Hiện nay, tuy đã có nhiều nghiên cứu RCT và nghiên cửu dịch tế học, những 
số nghiên cứu có chất lượng cao thì không nhiều. Đối với một số bệnh như ung 
thư, loaäng xương, tìm mạch, tiểu đưững, đã cỏ rất nhiễu nghiên cứu chuyên sẵu 
làm cư sử cho y học thực chứng [29]. Tuy nhiên, đổi với phần lớn các bệnh khác, 
củn rất nhiễu câu hỏi quan trọng chưa được giải quyết, đồng thởi những bằng 
chứng hiện có thưởng không có độ tin cậy và độ chính xác cao [16-18]. Có nhiễu 
giảo sư mỉa mai rằng thực hành lâm sàng ngày nay chẳng khác gì “lang băn?” thời 
xu xưa, bởi vi không dựa vào chứng cử khoa học. 
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Mới đây, một số tổng biên tập các tập san quốc tế công bố những hướng dẫn 
cụ thể về thiết kế, bảo cáo các nghiên cứu lắm sàng [30] và phần tích tổng hợp 
[31]. Trong tương lai, chất lượng nghiên cứu y học chắc chắn sẽ cải tiến theo 
thời gian, và chất lượng thông tin cũng sẽ tăng theo, đồng thời y học thực chứng 
sẽ trở thành một kim chỉ nam cho quyết định lãm sàng. Không những thể, các 
chỉnh sách công về y tế cũng sẽ phải dựa vào các nguyên lí của y học thực chứng. 
Trong tương lai, việc giải mã gen có thể sẽ dẫn đến xu hướng y khoa cả nhãn 
hóa (personalized medicine}, mà theo đỏ, quyết định điểu trị sẽ dựa vào cấu trúc 
của gen và yếu tổ nguy cử đặc thủ của một cá nhãn. Y học thực chứng và các 
nguyên li của y học thực chứng sẽ củn tiến hóa và đóng vai trò quan trọng trang 
xu hướng y khoa cá nhân hỏa. 
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NHỮNG KHÁI NIỆM Cũ BẢN 
VỀ THŨNG KÊ 
PHÂN I: CÁC PHƯƠNG PHÁP Mô TẢ 


hạc. Hiệu quả của can thiện đu được định lượng hẳn, và kẽm then các chỉ 

số phản dnh sự bất định. Cách thiết kể một công trình nghiên cứu RT 
cũng dựn trên các nguyên lỉ của thống kê, từ phân nhằm đến phân tích dữ liệu. 
Da đủ, người thầy thuốc tiễn cận với y hạc thực chứng cần phải làm quen và hiểu 
những khải niệm cơ hản về thấng kê hạc cũng như tịch tễ hạc. Trang chương này, 
lỗi sẽ mũ tả một số khải niềm và thuật ngữ thường hay thấy trang y vẫn. Tôi sẽ 
mình họa các nhưng nhắn này hằng một vỉ dụ cụ thể, và nếu cẩn dùng nhẫn mễm 
R để minh hạa cách tính tản. 


VY. thực chứng sử dụng rất nhiều các khải niệm thống kê học và dịch tễ 


Quần thể và mẫu (pupulation và sample) 

Chữ quấn thể là dịch từ khái niệm papulaiian trong thống kẻ. Chữ napulatinn 
ở đây không có nghĩa là dân số như chúng ta thưởng hiểu, mà là một tập hợp 
các đơn vị mả mẫu có thể rút ra. “Đơn vị” ở đây có thể là con người, bệnh viện, 
hiến cổ lãm sảng, v.v... Do đó, trong thống kê chúng ta có thể nói “quần thể bệnh 
viện. Những gì liên quan đến quấn thể chúng ta gọi là thắng số (parameter). 
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Mẫu (sample) là một phần của quẩn thể. Một mẫu có thể được chọn ngắu 
nhiên tử một quấn thể. Có nhiều kỉ thuật để chọn mẫu ngẫu nhiên và đảm bản 
tính đại diện quân thể. Những chỉ số liên quan đến mẫu được gọi là siafisiic hay 
saminle statistic. Chẳng hạn như số trung bình là một sample statistic. Chúng ta 
dùng sample statistic để ưúc tính hay suy luận về thông số của quần thể. 


Phân tích [TT và PP 


TTT là viết tắt của chữ ”“intention to treat, và PP là “Per Protocol Hai thuật 
ngữ này hay xuất hiện trong y văn, đặc biệt là các nghiên cửu RCT. Phần tích 
TTT là phản tích dựa theo kể hoạch từ lúc phản chia ngẫu nhiên hóa bệnh nhắn, 
củn phân tích theo kế hoạch PP là phản tích trên những bệnh nhân đã hoàn tất 
nghiên cửu. 

Trong nhiễu nghiên cửu, bệnh nhãn không tuẫn theo kế hoạch điểu trị, hay 
rút khỏi công trình nghiên cứu, nói chung là “bỏ cuộc” Vấn để đặt ra là chủng 
ta nên phản tích như thể nản trong những trưởng hựp nảy. Một số nhà nghiên 
cứu loại bỏ các bệnh nhân không tuản theo kế hoạch trong phản tích, và hình 
thức phần tích này được gọi là PP analysis hay cfficacy analysis. Nhưng vấn để trở 
nên rắc rỗi khi lí da mả bệnh nhãn không tuần theo kế hoạch có liên quan đến 
phương pháp can thiệp. Có nhiều chứng cử cho thấy người tuần theo kể hoạch 
nghiên cứu thưởng là những người có đáp ứng tốt hơn (có lẽ khỏe mạnh hơn) 
những người bỏ cuộc. Da đó, loại bỏ những người bỏ cuộc khi nhân tích có thể 
dẫn đến hias. 


Một vỉ dụ (giả thuyết) sau đây sẽ minh họa cho vấn để phản tích PE Giả dụ 
răng chúng ta có 200 bệnh nhãn, và phản chia ngẫu nhiên thành 2 nhóm: 1ũ0 
bệnh nhãn được điểu trị bàng phẫu thuật + acetylsalicylic acid (ASA), và 100 
hệnh nhãn chỉ được điểu trị hãng Ä5A. Giả dụ rằng nhẫu thuật thật sư lhông cỏ 
hiệu quả, tỉ lệ bị đột qui nhỏm phẫu thuật + A5A bằng với nhỏm Ä5A. 


Trong nhỏm phẫu thuật + Ä5.À arm, có 10 bệnh nhân bị đột quị trang vủng Ï 
tháng chử đợi để được phẫu thuật. Phần còn lại 9ũ bệnh nhân được nhẫu thuật, 
và sau Ì năm thi có 10 người bị đột qui. 

Trong nhóm À5AÄ arm, cũng có 10 bệnh nhân bị đột quị trong vòng 1 tháng 
sau khi được phân nhóm (tất cả 10 người đếu được điểu trị với A5A). Phần còn 
lại 90 bệnh nhẫn vả sau Ì năm điểu trị bằng ASA thì có 1Ũ người hị đột qui. 
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Mếu chúng ta giới hạn phân tích trong nhằm phẫu thuật + A5A những người 
được phẫu thuật (tức là phản tích PP), tỉ lệ sẽ là 10 / 9ũ = ñ.11. Côn trong nhỏm 
Ä5A thi tỉ lệ là 20/100 = 0.30. Trong trường hợp này, phầu thuật giảm nguy cử 
đột qui (tử 20% xuống còn 11⁄4). Nhưng chúng ta biết rằng kết quả này sai, vỉ 
phẫu thuật không có hiệu quả. 

Nhưng nếu phản tích TTTT, chúng ta phải dùng mẫu số lúc phản nhóm ngẫu 
nhiên (tức n = 1ũŨ cho mỗi nhóm). Trong nhỏm phẫu thuật + ASA, tỉ lệ đột qui 
là 20/100 = 0.20. Trong nhóm A5A cũng 20/100 = 0.20. Như vậy phản tích TTT 
phản ảnh đúng với thực tế hơn phản tích PE 


Lũ gizpbp EŨ straäie 
" Lị 
D. r ITT 
"= lữ £ 
ae. ?ð / lôõ 
Super 
Sungprý + A5A 
Bệnh nhẳn 1 thắng 1 nằm 
A$A 
| 088804 3ð / IBØ 
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Khác biệt giữa phân tích theo kế hoạch ITT và PP. Hai nhóm bệnh nhân [n = 100 mỗi 
nhóm]. Nhóm phẫu thuật + Ä5Ä có 1ũ bệnh nhãn bị đặt qui trước khi phẫu thuật 
nhưng sau khi phân nhỏm 1 tháng. Số 80 còn lại dược phẫu thuật và theo dõi Ï năm 
thì cá 10 người bị đặt qui. Nhöm ÄŠ5AÄ có 20 người bị đặt qui, T1ũ người sau 1 thăng 
phân nhóm, 1ũ ca dột qui khác xảy ra trong vòng T tháng đến T năm. Với phân tích 
ITT, tỉ lệ dật qui của nhóm phẫu thuật + ASA là 20/100 = 0.20, bằng với nhằm ÄSR. 
cùng 20/100 = 0.20. Nhưng nếu phãn tích PF, tỉ lạ đột qui của nhóm phẫu thuật + 
A5A là 10/100 —0.10, thấp hơn nhỏm Ä5ÃÄ 20/100 — ñ.30. Phăn tích PP cho ra kết quả 
không dùng với thực tế, tức bias (R = randomiration, tức phãn nhữm ngẫu nhiên]. 


Thông kẻ mỗ tả và suy luận 

Sách giảo khoa thống kẻ thường phản loại hai nhỏm phương pháp: mô tả 
(description) và suy luận (inierence). Các phương pháp như tính toán trung 
hình, trung vị, độ lệch chuẩn, tỉ lệ, hiểu đổ, v.v... được xem là nhản tích mỗ tả. 
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Các phương pháp so sánh và kiểm định giả thuyết khoa học (như kiểm định t, 
hỗi qui tuyến tỉnh) được xem là phần tích suy luận. Tuy nhiên, các phân chia nảy 
thường không có ích, và theo tôi là không hẳn đúng. Trong thực tế, các phân tích 
mỗ tả cũng có thể giúp chúng ta suy luận về quần thể qua tỉnh toán khoảng tin 
cậy. Vì thế, tuy chúng ta cần hiết hai nhương pháp, nhưng cũng không nên quả 
lệ thuộc vào sự nhẫn hiệt nảy. 


Các phương pháp so sánh hay kiểm định thống kẻ (statistical test] thường 
dựa vào nguyễn lí phát hiện tín hiệu (signal detectian}] và nhân hiệt với nhiễu 
(noise). Một đo lưỡng có thể xem có hai phần: phần hệ thống (hay tín hiệu) và 
phần ngẫu nhiên (nhiễu). Gọi một đo lưởng là X, phần hệ thống là T và nhắn 
ngắu nhiên là E, có thể viết: 

X=l+E 

Cũng có thể xem T là nhần do mỗ hình thống kẻ và E là phần không thể giải 
thích bảng mỏ hình. Phần lớn các kiểm định thống kẻ thưởng xuất hiện dưới 
hình thức tỉ số R=T. Da đó, nếu R = Ú, thi tất cả dao động của do lưỡng X là 
hoàn toàn do nhiễu; nếu R = 1, thi phần tín hiệu bảng phần nhiễu và chúng ta 
không thể kết luận gì về X; nhưng nếu R > 1 (chẳng hạn như R = 10), chúng ta 
cảng tự tin rằng độ dao động của X cỏ thể giải thích bằng mỗ hình (hay tín hiệu). 

Vấn để đặt ra là giá trị của RÑ cao bao nhiêu để chúng ta có thể kết luận rằng 
giả trị đo lường X không phải do các yếu tổ ngắu nhiên? Lí thuyết xác suất - 
thống kẽ cung cấn cho chúng ta nhiểu trị số dựa vào các luật phản phối thông 
thường như phản bố chuẩn (normal distribution), phản phối t, F; v.v... để so 
sảnh. Nếu R cao hơn các giá trị lí thuyết, chúng ta có bằng chứng để kết luận rằng 
khác biệt về đo lưỡng không phải do yếu tổ ngắu nhiên gây ra. 


Phân biệt hiến số lâm sảng: liên tục và phân loại 

Các số liệu về nghiên cứu lãm sảng có thể tạm chia ra thành hai loại chỉnh: 
một loại mm các hiển số liên tục (continuous variahle) và một loại là các hiển số 
rời rạc, không liên tục, phần nhám (discrete variahle). Miột số biến số liên tục là 
độ tuổi, chiếu can, trọng lượng, áp suất máu, mật độ chất khoảng trung xương, 
v.v... Các biến số rời rạc tiêu biểu là giới (nam hay nữ), tình trạng bệnh (mắc 
bệnh hay không mắc bệnh), sống/chết, cả/không, hay các giai đoan của ung thư. 
Các phương pháp phân tích cho các biến số liên tục rất khác biệt với các phương 
pháp cho các biển số rời rạc. 
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Phân bố chuẩn (normal distribution]) 

Phần lớn li thuyết thống kẽ dựa vào luật phân bố chuẩn. Các phương pháp 
tính toán như khoảng tin cậy 95%, kiểm định t, Ki bình phương, mỏ hình hỏi 
qui tuyến tính, v.v... đếu dựa vào giả định là phản bổ của dữ liệu tuần theo hay 
gần với luật phân bố chuẩn. Trong thực tế, đúng là rất nhiều đo lưỡng lắm sảng 
và chỉ số sinh học đếu tuẫn theo luật phần hố chuẩn. 

Luật phản hỗ chuẩn được xác định bởi hai thông số: trung hình (bu) và độ lệch 
chuẩn (ø). Nếu biến X tuân theo luật phản bố chuẩn với trung hình u và độ lệch 
chuẩn œ, thi xác suất X = x có thể xác định qua công thức nổi tiếng sau đây: 


P(*= x|mơ? )~—e =Í 

Chủ ý rằng cũng thức trên đôi khi cũng xuất hiện trong các sách giảo khoa 

với một hình thức khác: thay vì viết P{X =z| m,ø°), có tác giả viết khó hiểu 
hơn là f{x). Tất nhiên, trong công thức trên, n = 3.1416. 


(x-a} 


Ví dụ. Nếu chủng ta biết rằng chiếu cao của nam giới Việt Nam có giá trị 
trung bình là 163.3 cm và độ lệch chuẩn 6.6 cm, chúng ta có thể vẽ biểu đổ phân 
hố chiểu cao cho quần thể theo công thức trên như sau: 


Probability distrlbutlon of heighit in Vietnamese men 
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Hình T. Mặt đệ xác suất chiều cao ử dân ông Việt Nam 
với trung bình 163.3 em và độ lệch chuẩn 6.É cm. 
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Tất nhiên, tổng diện tích dưới đường biểu diễn phải bằng 1 (hay 100%). biểu 
này cỏ nghĩa là nếu chúng ta muốn tiớc tỉnh xác suất cho bất cử khuảng chiếu 
cao nảo. Vĩ dụ nếu chúng ta muốn biết có ban nhiễu đản ông Việt Nam có chiếu 
thấp hơn 15Ũ cm, chúng ta chỉ cần tỉnh diện tích mả trục hoành từ 150 cm hay 
thấp hơn dưới đường biểu diễn. Phát biểu theo ngôn ngữ toán học câu hỏi này 
là: P(X < 150) =? Hay nói chỉnh xác hơn nữa: 


P(X <150| „=163.3,ø =6.6)=? 
Tuy nhiên, có một cách tính nhanh hơn và "tính vĩ” hơn là sử dụng tích phân. 
Bạn đọc nảo còn nhớ tích phản thì câu trả lời cho cầu hỏi này quá đơn giản: chỉ 
cần tính tích phản chiếu cao tử Ũ (thấp nhất) đến 149 cm: 


P(X <150)= [` /(x}w 


: I (x- —: 
trong đỏ, — —=cx 
ng đó, ƒ(x) n2 I 2(6 2| Kết quả tất nhiễn là 0.018. 


Bạn đọc không cẩn phải làm các tỉnh xi cà phân phức tạp, vì phẩm mềm 
R cỏ một lệnh đơn giản để tỉnh tích phản trên: pnorm(149, mean = l63.3, sd = 
6.6). Biểu đổ dưới đây minh họa cho xác suất này bằng cách tô đậm diện tích 
dưới đường hiểu diễn để bạn đọc có thể hiểu rõ hơn: 


Prabahllty distrlbutlan öf hưighi ln WViatrnamesu mạn 
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Diện tích dưới dường biểu diễn [phần tô dặm] cho chiều cao < T15Ú cm 
là xác suất P(X < 150| „ = 163.3,z =f.6]= 018, 
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Phân bố chuẩn hóa - standardized normal distribution 


Trong nhần trên, chủng ta quan tầm đến việc nhẫn tích chiếu cao băng cách 
ứng dụng luật phản phối chuẩn. Tuy nhiên, như để cập trong phần đu, luật 
phân phối chuẩn cỏ thể ứng dụng cho rất nhiều hiện tượng tự nhiên. Nhưng cắc 
hiến khác nhau về đơn vị đo lưởng, như chiểu cao đo bằng cm, nhưng huyết áp 
đo bằng mmHg, nên chúng ta khỏ mà so sánh hai biến số này bởi vì chúng cỏ 
đơn vị đo lường khác nhau, và có thể độ lệch chuẩn cũng khác nhau. Chẳng hạn 
như nếu một đối tượng cỏ chiếu cao là Ì75 cm và huyết áp là 120 mmHg, làm san 
chúng ta biết các thông số cá nhãn này cao hay thấp. Do đó, chúng ta cẩn phải có 
một cách chuẩn hóa luật nhãn phối sao cho chúng ta có thể so sánh các biến số 
này mả không cẩn biết đến đơn vị đo lưỡng. 


Như thấy trong công thức phản bố chuẩn, hai thông số trung bình và độ lệch 
chuẩn hoàn toàn xác định luật phân phối chuẩn, cho nên, một cách chuẩn hóa 
là huán chuyển chiếu cao (hay một hiển số) sao cho chúng độc lập với đưn vị đo 
lưững. Cách houắn chuyển này có tên là z-fransfprmatian hay hoán chuyển z. Kết 
quả của huản chuyển là một chỉ số z (thuật ngữ tiếng Ánh là z-scorc}. Trung vỉ dụ 
về chiếu cao, z là độ khác biệt miữa chiều cao một cá nhẫn (kí hiệu là x) và chiếu 
cao trung bình của quấn thể chia cho độ lệch chuẩn. Nói cách khác: 

x.——F 
Œ 


Bởi vỉ x, w và ơ trong công thức trên đây đếu cỏ cùng đơn vị (cm), và cm chia 
cho cm thi không biển mới hoàn toàn đặc lập với đơn vị do lưỡng. Thật ra, đơn 
vị của z hãy miở không củn là cm nữa, mả là độ lệch chuẩn. Xem kĩ công thức trên 
chúng ta có thể rút ra vải nhận xét như sau: 

s® Nếu chiếu cao của một cá nhãn thấp hơn chiểu cao trung bình của dân số 

(tức là x < u} thi chỉ số z sẽ âm. Chẳng hạn như nếu ông A có chiểu cao 
150 cm, thì chỉ số z của ông là „129-1632 _ _2 n1, tức là thấp hơn chiểu 
cao của dẫn số khoảng 2 độ lệch chuẩn; 

« Nếu x =u, chỉ số z sẽ là Ũ; 

« Và nếu x > u, chỉ số z sẽ là số dương. Chẳng hạn như nếu chiểu cao của 


một đối tượng läà 175 cm, thi z = 1.77. Nói cách khác, chiểu cao của đối 
tượng này cao hưn trung hình khoảng 1.8 độ lệch chuẩn. 
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Như vậy, thay vì mỗ tả sự phân phối của chiểu cao bằng đơn vị cm với hàm 
số phân bố chuẩn, chúng ta mô tả bằng đơn vị độ lệch chuẩn hay chỉ số z. Chỉ 
số z bảy giữ có số trung bình là u = Ũ và độ lậch chuẩn là œ = 1. Hàm số phần bố 
chuẩn hóa hảy mữ đưn giản hơn như sau: 


I z 
/£)=-=|~5| 
Và hàm số tích lũy sẽ trở thành: 


P(a<z<b)= [` f(z}b -[ “+ 


Biểu để 4 dưới đây mình họa cho phần phối chiểu cao tính hằng cm và bằng 
chỉ số z: 
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Mặt đệ xác suất chiều cao ở dân ông Mặt dộ xác suất của phản phối chuẩn f|z], 
Việt Nam, mö tả bằng cm. với trung bình ñ và độ lệch chuẩn 1. 


Cũ nhiên, diện tích dưới đường biểu diễn của hàm số f{z) trong biểu đổ 
trên phải là 1. Nói cách khác, {~4 < z <4)= ƒ /{z:Mw = 1. Ngoài ra, phân phổi 
chuẩn còn hàm chứa một số thông tin có ích và thú vị: 
se Xác suất mà z < 1.86 là 0.025 (tức 2.591. Nói cách khác, điện tích dưới 
đường hiểu diễn tỉnh từ z = -1.96 hay thấp hơn là 0.025. 

s Bởi vi phản phối chuẩn cản đổi (symmetric). chúng ta cũng có thể nói 
(hay suy luận) rằng xác suất mà z z 1.96 cũng bằng 0.035. 

s® Như vậy, xác suất mả z năm trong khoảng -1.96 và 1.96 là 1-0.025—-0.025 = 
0.95 (hay 95M). Nói cách khác, khoảng tin cậy 959% của z là -I.96 đến 1.86. 
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s® Tương tự, chúng ta cũng có thể phát biểu (và bạn đọc có thể tự mình kiểm 
chứng) rằng xác suất mả z năm trang khoảng -I.645 đến 1.645 là 90: Xác 
suất mả z nằm trong khoảng -2.576 đến 2.576 là 99%. Xác suất mả z năm 
trung khoảng -3.09 đến 3.08 là 99.0. 


Đến đây, chúng ta đã thấy hằng số 1.96, 1.64 hay 3.0 xuất phát từ đâu! Các 
hằng số này chẳng có gì bí mặt cả: chúng là chỉ số z của phân phối chuẩn. Bảng 
sau đây sẽ cung cấp một số xác suất cho các chỉ số z thông dụng trong thống kẻ 
học và ứng dụng trung y khoa. 

Bảng 2. Xác suất các giả trị z 


7 [Im[2]as[iszlazm[s [is] ix[ 2a. 


[EgZ<2 | oạm | ai |aasz aøs | 0o |as0| nao | 0525| nọ [os, 


Khoảng tin cậy 95% 


Bảy giờ chúng ta sẽ điểm qua vải ứng dụng luật phần phối chuẩn trong y văn. 
Vi cỏ quả nhiều ng dụng, nên tôi chỉ tận trung vào những vẫn để liên quan đến 
những bải giảng của tôi, và một vấn để mả chúng ta hay thấy là ước tính khoảng 
tin cậy 95% (thuật ngữ tiếng Ánh là 95% conftdence interval hay có khi còn viết 
là 95% canfrdence limit, thậm chỉ 95% creriihle imterval). 


Trong nhiễu nghiên cứu y học mang tính mỗ tả, chúng ta thưởng muốn phát 
triển một cách tham chiếu (reftrenrce range hay có khi gọi không chỉnh xác là 
nurmal range). Chẳng hạn như để phát triển các giá trị tham chiếu cho một hiển 
số sinh hóa như calcium trong máu, chúng ta có thể ngẫu nhiên chọn một số đối 
tượng vả do nẵng độ caÌcinum trang máu, sau đỏ tính khoảng tin cậy 95%. Khoảng 
tin cậy 95% này chính là các giá trị tham chiếu. Nếu nỗng độ calcium trong mắu 
của một cá nhãn năm ngoài khoảng tin cậy 95% thi chúng ta có thể (xin nhấn 
mạnh: “cỏ thể”) phát biểu rằng nỗng độ của cả nhắn nảy “hất bình thường”. 


Để ước tính khoảng tin cậy 95% (KTC95), chúng ta chú ý mối liên hệ giữa x 
và z vì z=—£", do đó: 
Œ 


x=jrzơ 

Như để cận trong phần trên, 95% giá trị của z năm trong khoảng -1.96 đến 
+1.86, cho nên chúng ta cũng có thể nói rằng 951u giả trị của x nằm trong khoảng 
#=ũT—1.96œvà +1.96œ . Hay nói ngắn mạn hơn, 959ú các giả trị x năm trong khoảng: 
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n+1.86xœ 

Quay lại với ví dụ về chiếu cao, chúng ta biết rằng số trung bình là 163.3 cm 
và độ lệch chuẩn là 6.6 cm. Dao đó, chúng ta có thể suy luận rằng 95% đàn ông 
Việt Nam có chiếu cao trang khoảng 163.3 + 1.96 x 6.6 = 150.4 cm đến l 76.2 cm. 

Tất nhiên, chúng ta cũng có thể ưức tính xác suất 99% chiểu cao đàn ông Việt 
Nam năm trong khoảng 163.3 + 3 x 6.6 = 143.5 cm đến 183.1 cm. Do đó, nếu 
một người đản ông có chiều cao thấn hơn 143.5 cm, chúng ta có thể nói là “thấp, 
với xác suất dưới (I.514! 

Tùy theo vấn để cụ thể, nhưng phần lửn các giả trị tham chiếu trong y khoa đếu 
lấy khoảng tin cậy 351% làm chuẩn. Khi xác suất một chỉ số thống kẽ năm ngoải 
khoảng tin cậy 95%ú được xem là “có ý nghĩa thống kế” (statistically signilicant). 

Với các khái niệm cơ bản trên, bảy giử chúng ta sẽ điểm qua một số phương 
pháp thống kẻ mỗ tả và suy luận. 


1. Trung bình, phương sai và độ lệch chuẩn 
Bối với một hiến số liên tục, chúng ta có thể mỗ tả bàng ba chỉ số thống kẻ 
chính: đó là số mẫu (sample size}, trung bình (mean) và phương sai (variance). 
Từ phương sai và số mẫu chúng ta có thể ước tính độ lệch chuẩn (standard 
deviaHon] và sai số chuẩn (standard error}. 
Vỉ dụ l: Số liệu sau đây là trọng lượng (tỉnh hãng kg} cho 20 phụ nữ Việt Nam 
tuổi từ 32 đến 719. 
45.0, 358.0, 57.0, 49,5, 57.0, 42.0, 54.0, 54.0, 34.0, 45.0 
42.0, 49.0, 2.0, 57.0, 5.0, 61.0, 49.5, 48.0, 54.0, 40,0 


Trọng lượng trung bình của 20 phụ nữ có thể đước tính bằng cách lấy tổng 
trọng lượng chia cho số mẫu. Nói theo ngôn ngữ toán thống kẻ, gọi +x, là trọng 
lượng của cá nhân ï (¡ = 1, 3, 3,..., 20). Ước số trung bình được định nghĩa là 


-_ là 
zử ” _ >" 
(Dấu 2Ö có nghĩa là tổng số cha n đối tượng). Theo thông lệ, chỉ số nảy 
thường được viết với một dấu ”-” (bar) để phân biệt với số liệu của từng cả nhẫn: 


45+3Rñ+..+54d+d 
Kem = 48.1 kụ 
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Nhưng như chúng ta thấy, trọng lượng của từng cá nhân không phải là 48.1 
kự mã dao động từ 27 kự đến 61 kg. Một số thống kê khác thưởng được sử dụng 
để mỗ tả độ dao động nảy là phương sai (variance) và được tính bằng cách 
lấy tổng bình phương của khác biệt giữa trọng lượng của từng cá nhân và số 
trung hình rồi chia cha số mẫu. Số này thường được viết bằng z”, công thức của 
phương sai là 

g” _—— (x—*} 
nlÌn 
Trong vỉ dụ trên, chủng ta cỏ: 
dš- (45— 48.1)` +(38—48.L} cc1— I} +(49—48.L} FT 

Vì đơn vị của nhương sai là kg bình nhương, rất khỏ diễn địch, cho nên một 
cách chuyển hóa về đơn vị mốc là kụ, chủng ta chỉ đơn giản lấy căn bậc hai của 
phương sai, và kết quả được gọi là độ lệch chuẩn (standard deviation) thường 
được kỉ hiệu bằng s: 


g=xj*+° =2J?14= 84kg 

Khoảng tin cậy 95% có thể ước tỉnh tử trung bình và độ lệch chuẩn. Giả 
định răng chiểu cao tuân theo luật phản bố chuẩn, khoảng tin cậy 95%: có thể 
tính như sau: 

mean + l.96 x sd 
Con số 1.96 là một hằng số tử nhãn phối chuẩn. Trong vỉ dụ trên, chúng ta có: 
48.1 + 1.86 x 8.4 = 31.6 đến 64.6 

Ở đây, qua hai số trên, chúng ta có thể suy luận rằng 95% phụ nữ có trọng 
lượng dao động trong khoảng trong khoảng 31.6 đến 64.6 kự. Trong thống kẻ 
học, khoảng đan động này thưởng được gọi là khoảng tín cậy 958 (hay 959 
canldence interval]. 


Sai số chuẩn (standard errar) 


Bởi vi chúng ta không biết chính xác trọng lượng của toàn thể phụ nữ người 
Việt là bao nhiễu, nên chúng ta phải lấy mẫu. Trong ví dụ trên số mẫu là 2Ú 
người. Tất nhiên, nếu chúng ta chọn 2Ũ người khác thì số trung hình và độ lệch 
chuẩn cũng có thể khác với các số mà chúng ta vừa ước tính. Nếu chúng ta lấy 
mẫu nhiễu lẩn (1 triệu lần chẳng hạn), và cử mỗi lẫn có 20 phụ nữ, chủng ta sẽ 


- —~ 


cỏ Ì triệu số trung bình. Cầu hỏi khác đặt ra là độ dao động của l triệu số trung 
hình này như thế nào? 


Để trả lời câu hỏi trên, chúng ta cẩn đến một chỉ số khác cỏ tên là sai số 
chuẩn. Sai số chuẩn (kí hiệu SE) được ước tỉnh bằng cách lấy độ lệch chuẩn chia 


cho căn số bậc hai của số mẫu: 


3 8.d 
SE=-==- TC =I.88lg 
Qua định lỉ của phân phối chuẩn, chúng ta cũng có thể ước tỉnh rằng 951 
số trung bình trọng lượng sẽ dao động từ 48.1 — 1.96 x 1.88 đến 48.1 + 1.96 x 
1.88, tức từ 44.4 kg đến 51.8 kg. Chú ý KTCS5 tính từ SD phản ảnh độ đao động 
giữa các cá nhân, củn KTCSB5 tính từ SE phản ảnh độ đao động giữa các số trung 
hình mẫu. 


2. Tỉ lệ hiện hành, độ lệch chuẩn, khoảng tin cậy 95% 


Tï lệ hiện hãnh (prevalence proportion) là chỉ số dùng để mỗ tả một hiển 
phân nhóm, thường chỉ có hai giả trị: bệnh/không bệnh, sống/chết, có/không, 
v.v... Tỉ lệ hiện hành thường được tức tính từ các nghiên cứu cắt ngang. Chúng 
ta có thể hiểu qua cách mỗ tả một tỉ lệ hiện hành qua vỉ dụ sau đây. 

Vĩ dụ 3: Trong một nghiên cửu về loãng xương, chúng tôi đo lường mật độ 
xương ở 821 đản ông tuổi từ 6 trở lên. Trong số nảy, chúng tôi nhát hiện Ø0 người 
được xem là loäng xương. Như vậy, tỉ lệ hiện hành laäng xương (kí hiệu p) có thể 
được ước tỉnh bảng cách lấy số người hị lnäng xương chia cho tổng số mẫu: 

0ũ 
p, “m1” 0.1096 
(hay nói cách khác, khoảng 119 đàn ông bị louäng xương trong quần thể này). 
Cũng như trong trưởng hợp biển số liên tục, chúng ta cũng có thể ước tính 
phương sai của p, nhưng công thức thi khác nhau. Gọi s°là phương sai của p, 
chúng ta có: 


l— ú.I08ñ[I—ũ. 1096 
# _zL—P) — = 0.0001188646 
Và theo định nghĩa, độ lệch chuẩn của ñ (kí hiệu s) là: 


#=ajJs° =x[0.0001188 =0.011 
Cũng có thể dựa vào giả định phân phối chuẩn để ước tính độ dao động của 
tỉ lệ hiện hãnh như sau: 0.1096 — 1.96 x 0.011 = 0.088 đến ñ.1096 + 1.96 x ũ.01 1 
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= ñ.131. Nói cách khác, khoảng tin cậy 959% tỉ lệ hiện hành loãng xương trong 
đàn ông tuổi từ 6ñ trở lên dao động từ 8.8% đến 13.1%. 


3. Tỉ lệ phát sinh, tỉ suất phát sinh 


Trong nhiều nghiên cứu theo thời gian, các nhà nghiễn cứu theo đỗi một 
nhóm bệnh nhãn trong một thởi gian, và trong thời gian đó họ phí nhận bao 
nhiễu người znởi mắc bệnh. Tï lệ mắc hệnh trong thời gian theo dõi được gọi là 
tỉ lệ phát sinh (Incidence proportion). 

Vỉ dụ 3: Trong một nghiên cứu đoàn hệ gốm 3861 bệnh nhân được theo dõi 
3 năm. Trang thứi mian đó, có 8B bệnh nhãn hị gấy cổ xương đủi. Tỉ lệ nhát sinh 
có thể ước tính như sau: 


Cách tính độ lệch chuẩn và khoảng tin cậy 95% có thể ứng dụng công thức 
mỏ tả trong phần trên (tỉ lệ hiện hành). 


Một chỉ số khác để mô tả biến cế mang tính thời gian có tên là tỉ suất phát 
sinh (incidence rate}. Để tính tỉ suất nhát sinh, chủng ta cẩn phải biết thời gian 
theo dõi của từng bệnh nhắn. Mẫu số của tỉ suất phát sinh không phải là tổng số 
hệnh nhãn mà là bệnh nhãn nhãn cho thời gian. 


Ví dụ 4: Miột nhóm bệnh nhãn gốm 1Ũ phụ nữ tuổi trên 6Ù được theo dõi từ 
1989 cho đến cuối năm 2001 (31/13/2001). Trong thời gian này, có 3 phụ nữ hị gấy 
xương. Số liệu cho 10 bệnh nhắn có thể tảm lược trong bảng thống kẻ dưới đây. 


Bảng 1. Tẩn số gãy xương và thời gian theo dõi 


Bệnh NhẾn Ahmcyu — bigảy ương 
11 12/01/1388 
12 14/8/1990 21/3/1998 
13 27/3/1988 
1a ñ1/02/1988 17/3/1009 
15 07/3/1988 
lũ 21/11/1988 
1z ñ2/12/1s90 1/5/1992 
=_ 


1B 7/4/1988 
19 8/01/1580 
P.) 30/7/1989 


Để ước tính tỉ lệ phát sinh, chúng ta cẩn phải tỉnh thời gian theo dõi cho 
tửng bệnh nhân. Đi với 3 trường hợp hị gắy xương, thởi mian này chỉ đơn giản 
là thời gian từ khi tham gia nghiên cứu đến ngày hị gãy xương. Nhưng đối với 
những người chưa hị gãy xương, vẫn để không đưn giản. Cách ước tính thời gian 
thường được chấp nhận là lấy ngày mới tham gia nghiên cứu cho đến ngày khỏa 
số nghiên cứu (tức 31/12/2001). Thời gian theo đỗi như sau: 


Thửi gian 
ltaroa theu SN 
H1 1295 
l2 #.B1 
13 12.77 
l4 10.13 
l5 12.32 
l6 12.12 
17 1.41 
1B 12.74 
19 11:88 
+ũ 12.43 

Tổng sẽ 106.49 


Như vậy tổng số thởi gian theo dõi cho 1Ũ bệnh nhân là 106.49 năm. Trong 
thuật ngữ dịch tế học, người ta gọi là 106.49 person - years (hay năm - người). 
Tử đó, tỉ suất phát sinh (kỉ hiệu bằng ï]) là: 


tức 3.82 trên lŨũ nắm người. 


Vì tần số người hị gãy xương thưởng thấp, và trong trưởng hợp nảy, luật nhân 
hổ Poisson thường được ứng dụng để ước tính độ lệch chuẩn và khoảng tin 
cậy 051: Do vải lí do tuản học, cách tính độ lệch chuẩn cho T phải dựa vàn một 
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phương pháp mián tiếp: tính phương sai của log(T). Phương sai của của Íag(1) chỉ 
đơn giản là 1 chia cho tẩn số gầy xương (x): 


— 0.333 
3 


var (lng Ủ ) =— 
X 

Do đả, độ lệch chuẩn của Íng(1) là: 
s=.|war(log7) =j0.333 =0.58 


Từ số này, chúng ta có thể ước tính khoảng tin cậy 95% của Ï như sau: 


eh 

đến ?e””", Trong trường hợp trên, khoảng tin cậy 95% cho tỉ số phát sinh gãy 
0282 _ [3MjDH] — : v... : 
TH — 0.009 đến 0.0282xe = .087. Cũng có thể diễn dịch 

khác là xác suất 95% của tỉ lệ phát sinh dao động từ ñ.9 đến Š.7 trên mỗi 1ŨŨ 


xương lả: 


nắm - người. 


4. Sa sánh hai tỉ lệ hiện hành 


Nguyên lí so sánh hai tỉ lệ cũng không khác với nguyễn lí so sánh hai số trung 
hình, nhưng chỉ tiết tỉnh toán thì khác nhau. Nói chung, kiểm định thống kê sử 
dụng cho so sánh hai tỉ lệ vẫn là tỉ số của “tín hiệu” (signal) và nhiễu (noise). Tin 
hiệu ở đây là mức độ khác hiệt trung bình và nhân nhiều là sai số chuẩn. Nếu tỉ 
số này cao (chẳng hạn như hơn 3), chúng ta có cơ sở để phát biểu rằng độ khác 
biệt có ý nghĩa thống kê; nếu tỉ số thấp (như bằng 1 chẳng hạn) thì phần tín hiệu 
bằng với phần nhiễu và sự bất định chưa đủ thấp để khẳng định rằng sự khác 
hiệt có ý nghĩa thống kẻ. 


Ví dụ 5: Trong một nghiên cửu cắt ngang ử 7ñ phụ nữ Việt Nam tuổi trên 
60, chúng tôi phát hiện 148 người bị loãng xương. Trong một nghiên cửu khác ở 
Úc trong 1287 phụ nữ cũng trên tuổi 60, có 345 người được chẩn đoán là loãng 
xương. Vấn để đặt ra là hai tỉ lệ này có khác nhau hay không. 


Trong nhóm người Việt, chủng ta có thể ước tính tỉ lệ loãng xương (kỉ hiệu 
là m) và độ lệch chuẩn: 
P,= 148 / 700=0.2H1 (tức 21.1%) 


F* 0.21141—-0211 -0015 
i Tủu 


Tương tự, trong nhóm người Ức, tỉ lệ loãng xương và độ lệch chuẩn là: 
P,= 345 l 1287 = U.268 (tức 26.8M) 


l0.268(1—0.268) 
By = VỀ =0.012 
128? 


Như vậy, tỉ lệ laãäng xương ở người Úc cao hơn người Việt, và độ khác biệt 
giữa hai nhóm (gọi là dj) có thể ước tính đơn giản là: 


rỉ = 0.368 - f.311 =0.057 
Bỏ là phần "tín hiệu. Bảy giờ chúng ta cẩn phải ước tỉnh phần “nhiễu”, hay 
phương sai (và do đó sai số chuẩn). Chúng ta biết rằng phương sai của hai biến 
số bằng tổng phương sai của hai biến. Nói cách khác, phương sai của ở là: 
số =s7 +ửi =(0/012} +(0.015}) =0.000369 
Do đó, sai số chuẩn của ở là: 


s„=AJs” =x0.000369 =0.019 


Kiểm định z (cũng giống như kiểm định ¡} được tính toán tử độ khác biệt 
và sai số chuẩn: 


_s, 0019 


Chỉ số z tuần theo luật phân phối chuẩn (normal distribution)}; cho nên nếu 
z can hưn 1.96 chủng ta có cơ sở để nói độ khác biệt có ý nghĩa thống kẽ. Trang 
trường hợp trên, chúng ta có thể nói rằng tỉ lệ loãng xương ở người Úc cao hơn 
tỉ lệ ở người Việt Nam. 

Một cách so sánh khác sử dụng khoảng tín cậy 95% có thể tiến hành như sau. 
Chúng ta biết răng nếu hiển số x tuân theo luật phần nhấi chuẩn với trung hình 
u và độ lệch chuẩn œ, thi khoảng tin cậy 9590 là w + 1.96 x ă. Tương tự, với độ 
khác biệt trung hình zỉ và sai số chuẩn z¿, thì khoảng tín cậy 85% là d. + 1.06xv.. 
Trong trưởng hợp trên, khoảng tin cậy 95% về độ khác biệt giữa hai tỉ lệ có thể 
ước tỉnh như sau: 

0.057 + 1.96 x 0.019 = 0.0197 đến 0.094 


Nói cách khác, xác suất 95% là tỉ lệ loãng xương ở người Úc cao hơn tỉ lệ ở 
người Việt tử 1.979 đến 9.4%. 
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5. ChỈds ratio (GR} 


dds rato, hay tỉ số odds, là một chỉ số thống kẻ dùng để đánh giá mối liễn 
quan giữa một yếu tổ nguy cơ và bệnh. ÖR thưởng được dùng trong các nghiễn 
cứu bệnh chứng, nhưng thỉnh thoảng cũng được dùng trong các nghiên cứu RCT. 
Vỉ dụ 6: Để nghiên cứu về mỗi liên quan giữa phơi nhiễm chất độc da cam 
(LAO) và ung thư tiễn liệt tuyển, các nhà nghiên cứu Mĩ chọn 47 bệnh nhãn và 
một nhóm chứng gốm 142 người. Họ thẩm định sự phơi nhiễm AÀO trong thời 
chiến tranh và kết quả như sau. 
Bảng 2. Phơi nhiễm chất độc da cam (AC) ở nhóm ung thư và nhóm chứng 


— PhơỉinhiễmAO Nhómungthư  Nhómchứng 


Có I1 1z 
Không 36 127 
Cách tính ÖR rất đơn giản: 


«Ổ Tỉnh adds phơi nhiễm trong nhóm ung thư: 
Odä, =}Ì — 0.305 
3ú 
«Ö Tỉnh œdds phơi nhiễm trong nhỏm chứng: 


Cuti =——=l 33 
127 


F. 


« Ô\WR chính là tỉ số của 2 odd:: 


0.133 
Một cách tỉnh OR nhanh hơn là tỉ số của hai tích số “mian chéo” trong hảng 


số liệu trên: 
_11x127 
_ 17x36 
Để tính khoảng tin cậy 95% cho OR, chúng ta cẩn phải tính sai số chuẩn của 
RE. Nhưng ÖR là một tỉ số, và rất khó tỉnh phương sai cho một tỉ số, nên chúng 
ta phải ứng dụng một phương pháp tính miản tiếp. 


=2 28 


s® Bước Ì: hoắn chuyển CTR sang đơn vị lag: 
LogOR = log(2.28) = 0.824 
« Hước 3: phương sai của logÖR là: 
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c—-Ee=ii=—— =[LIRE 
I7 36 127 


I1 L 
II 


Do đó, sai số chuẩn của lomOR là: 
$=x/0.185 =0.43 
«Bước 3: tính khoảng tin cậy 95% của logOR: 
lngOt + 1.96 x 5 = Ú.R24 + 1.96 x Ũ.43 = -0.0188 đến 1.667 
«Bước 4: hoán chuyển khoảng tin cậy 95% của logÔR sang đơn vị OR: 
exp(-I.188) = 0.98 
exp(1.667) = 5.29 


Kết quả cho thấy GR là 2.28 với khoảng tìn cậy 95% dao động trong khoảng 
I.98 đến 5.29. Bằng chứng về mỗi liên quan giữa nhơi nhiễm ÀÖ và ung thư tiền 
liệt tuyển chưa thuyết phục, vì phần dưới của khoảng tin cậy 95% dưới 1. 


6. Risk ratio (RR) dựa vào tỉ lệ 

Risk ratio hay relative risk có thể hiểu như là tỉ số của hai nguy cơ. RR thường 
được dùng trong các nghiên cứu đoán hệ và RCT; với thời mian theo dõi tương 
đương nhau giữa các cá nhắn. RR có lợi thế so với OR vì dễ hiểu và dễ diễn giải. 

Vi dụ 7: Các nhà nghiên cứu thực hiện một nghiên cứu RCT với 7736 phụ 
nữ sau mãn kinh, để đánh giả hiệu quả của zoledronic trong việc giảm nguy cơ 
gầy xương. Nghiên cứu có 3 nhóm: nhóm Ì gốm 3875 bệnh nhắn được điểu trị 
với zoledronate, và nhóm 2 gốm 3861 bệnh nhân trong nhỏm đổi chứng không 
được tiêm zoledronate (nhóm chứng]. Sau 3 năm theo dõi, có 52 bệnh nhắn trong 
nhóm zoledronate và 88 bệnh nhắn trong nhóm chứng hị gấy xương hỗng (hip). 


Bảng 3. Số ca gây xương thuộc nhóm zoledronic acid và nhóm chứng 


#nledronicacld Nhóm chứng 


(Cai 
Số phụ nữ 34875 386] 
Số ca gãy xương hồng 52 88 


Với số liệu trên, chúng ta có thể ước tính nguy cơ gãy xương hông ở nhỏm 
zuledranate: 
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Tương tí, nguy cơ gẩy xương ở nhóm chứng: 


Risk, =— Š_ =0.023 
3861 


Do đả, tỉ số nguy cơ là nguy cơ ở nhóm điểu trị chia cho nguy cơ ở nhóm chứng: 


Chúng ta không thể tỉnh khoảng tín cậy 95% của RR một cách trực tiếp, mã 
phải tỉnh giản tiếp. Qui trình giếng như cách tính KTC của ÖR, nhưng cũng 
thức cụ thể thi có phần khác:. 

s Hước l: hoán chuyển RR sang đơn vị log: 

LogRR = log(0.59) = -0.531 
s® Bước 3: phương sai của logRR lả: 
Ƒ “ÍS-as=Ì'Ís an) -I030 
352 3875 RR 386l 

Do đỏ, sai số chuẩn của logRR lả: 

#=0.030 = 0.173 
s® Hước 3: tính khoảng tin cậy 95% của lonOR: 

lourRR + 1.96 x § = -.531 + 1.96 x 0.173 = -0.871 đến -0.191 

s® Bước 4: hoán chuyển khoảng tin cậy 35% của logRR sang đơn vị RR: 

exp(-.871) = 0.42 

exp(-.191) = 0.83 

Kết quả cho thấy RE là ñ.59 với khoảng tin cậy 95% đao động trong khoảng 
.42 đến 0.83. Chúng ta có chứng cử để phát biểu răng zoledronic acid giảm 
nguy cơ uãy cổ xương đủi 411, và hiệu quả này có ý nghĩa thống kẻ. 

7. Risk ratio (RR) dựa vào tỉ suất phát sinh 

Có nhiễu nghiên cứu mà các cá nhãn không có cùng thời gian theo dõi. [3a 
đó, so sánh hai tỉ suất nhát sinh cũng dựa vào nguyễn lí tỉ số của tín hiệu và nhiễu 
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như trình bảy trên, nhưng thay vì dựa vào lỉ thuyết phân phối nhị phản (trong 
trưởng hựp so sánh hai tỉ lệ hiện hành), việc so sánh hai tỉ lệ phát sinh dựa vàn 
lí thuyết phản phối Poisson. 


Vĩ dụ 8: Công trình nghiên cứu Womens Health Initiative thẩm định sự ảnh 
hưởng của thay thể harmaone (hormaone replacement therany - HKT) đến nguy 
cử bị ung thư vú. Các nhà nghiên cứu theo dõi hơn 16000 nhụ nữ trong hơn 5 
năm, và trong thời gian đỏ, họ ghi nhận số phụ nữ mắc bệnh ung thư vủ trong 
nhóm sử dụng HRT và nhóm không sử dụng HRT (còn gọi là nhằm chứng) như 
sau (Bảng 4). 


Bảng 4. Số phụ nữ có chẩn đoán ung thư vú 
trong nhóm sử dụng HRT và nhằm đối chứng 


Spụnh than ga nghênh 


Thờiganthe dõi ung tình (hán) 


Câu hỏi đặt ra là có sự khác biệt nào về nguy cơ bị ung thư vú giữa hai nhóm 
hay không. Để giải quyết câu hỏi nảy, chúng ta cẩn phải trước hết ước tỉnh thửi 
gian näm - người, và sau đỏ là tỉ suất phát sinh cho từng nhóm. 

Trong nhóm HRT, thời gian tính theo person - years là (62.2/12) x B5Ù6 = 
44089. Tương tự, nhằm đổi chứng có thời lượng person - years là (61.3/12) x 
8102 = 41320. Chủ ý chúng ta chia cho 13 vi muốn chuyển từ tháng sang năm. 

Như vậy, tỉ suất nhát sinh ung thư trong nhóm HRT là 166/44089 = 0.00376, 
và trong nhằm đối chứng là 124/41320 = 0.00300. Có thể tôm lược các tỉnh toán 
trên trong hảng sau đây: 


Tỉ suất hị ung thư 


Thay vì thể hiện độ khác biệt bang cách trừ hai tỉ lệ, chúng ta sẽ tỉnh băng tỉ 
số nguy cơ (relative risk, RR). Tỉ số nguy cơ bị ung thư trong nhằm HRT so với 
nhóm đối chứng là: 
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np_ P‹_ 000376 — 
p, 0100300 


I.254 


Nói cách khác, tỉ lệ bị ung thư trong nhỏm HRT cao hơn nhóm đổi chứng 
259, Để biết tỉ số nguy cơ nảy có ý nghĩa thống kế hay không, chúng ta cần phải 
ước tính sai số chuẩn của RR. Tuy nhiên, vi khó khăn trong việc tính toản sai 
số cho một tỉ số, chu nên một cách tỉnh toán giản tiếp được phát triển. Theo 
phương pháp này, chúng ta sẽ tính phương sai và sai số chuẩn cho logRR (thay 
vị RR}: 

logRR = log(1.254} = 0.227 


Chúng ta biết răng phương sai của lagÏ là số đảo của tấn số biến cổ (hay l/x, 
mả x là tấn số của một biển cổ). Do đỏ, phương sai của logRR là: 
1 l l 


| 
vai | lùp RR Ì Ï —+—==—+—=-lñI3%E 
(Ioe ) 1%" + lún 128 


Và sai số chuẩn của lagRR là: 
# = .Ívar ( lug RR} = 20.0138 = 0.118 


Do đó, khoảng tin cậy 95% của logRR lá: 0.227 + 1.96 x Ũ.118 =—.00428 đến 
(I.458. Để chuyển về đơn vị gốc của RR, chúng ta cẩn phải lấy số mũ: e °°°”°* =1.00 
đến e””” =I.5R. Nói cách khác, tỉ lệ phát sinh ung thư vú trong nhóm HRT có 
thể bằng hay cao hơn nhóm đổi chứng đến 58%. Vi khoảng tin cậy 95% bằng 
hoặc cao hơn 1, chúng ta có cơ sở để phát biểu răng HRKT có ảnh hưởng đến nguy 
cơ ung thư vú, và ảnh hưởng nảy có ý nghĩa thống kẻ. 


9. Kiểm định t 


Trong nhiễu nghiên cứu, chúng ta muốn phát biểu về sự khác biệt và độ khác 
hiệt miữa hai nhóm. Khi số liệu (hiến số liên tục) được thu thận trên hai nhóm 
độc lặp với nhau (tức không có liên hệ gi với nhau), chúng ta muốn biết có hay 
không có khác hiệt giữa hai nhóm, và nếu có khác biệt thì mức độ khác hiệt là 
hao nhiêu. Trang trưởng hợp hai nhóm là nhóm điểu trị và nhóm không điểu 
trị thi “khác biệt” ở đây cũng gẩn đẳng nghĩa với ảnh hưởng của thuật điểu trị. 

Vĩ dụ 9: Số liệu sau đây là độ lysozyme trong dạ dày (đo hãng mg/L) của 29 
hệnh nhân với bệnh loét dạ dày (peptic ulcer) và 30 bệnh nhân không có bệnh 
(tức nhỏm chứng - placebo). Để đơn giản hỏa, tôi sẽ gọi nhóm bệnh nhân là 
nhóm À, và nhóm đổi chứng là nhóm P (Bảng 5). 
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Bảng 5. Độ Íysozyme trong nhóm bệnh nhẫn 
với loét tiều hóa (AÄ) và nhóm đối chứng (P) 


ũ.2, 0.3, 0.4, 1.1, 2.0, 3.1, 3.3, 5.8, 4.5, 4.8, 4.8, 5.Ú, 5.3, 7.5, 9,8, 10.4, 


10.5, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7, 34.0, 25.4, 40.0, 42.2, 50.0, 60.0 


ũ.2, 0.35, 0.4, 0.7, 1.3, 1.5, 1.5, 1.9, 20, 2.4, 2.5, 2.B, 3.0, 4.B, 4.8, 5.4, 5, 
5.8, 7.5, 8.7, B.8, 9.1, 1Ũ.3, 15.6, 16.1, 16.5, 16.7, 20.0, 20.7, 33.0 


Vì lysozyme là một hiến số liên tục, để biết lysozyme có khác nhau giữa hai 
nhóm hay không, một phương pháp phân tích chuẩn là kiểm định £ (t-test]}. 
Trước hết, chúng ta cẩn phải tôm lược số liệu của hai nhóm bằng số trung bình 
và độ lệch chuẩn như sau: 


TT [| Nám | NhômPĐ— 


"| mà | màn 
Say Sẽ 


z 
#.= 2AT.7T #.= 61.62 


#,=15.74 g„=7.85 

Như vậy độ khác biệt trung hình (kỉ hiệu d} mữa hai nhóm có thể ước tỉnh 
hãng: 

đi = 14.31 - 7.68 = 6.63 

Nếu hai nhóm không có khác biệt nhau, chúng ta kì vọng rằng di = [. Nhưng 
ở đây, d khá can, chúng ta có bằng chứng để cho rằng độ khác biệt lysozyme trong 
bệnh nhắn loét tiêu hỏa cao hơn người không có bệnh. Nhưng một phát biểu như 
thế không cỏ tỉnh “khoa học” nếu như chúng ta chưa xác định được độ khác hiệt đá 
xảy ra ngẫu nhiễn hay không. Để biết độ khác biệt ngẫu nhiên, chúng ta phải ước 
tính phương sai và độ lệch chuẩn của d¿. Vì hai nhóm bệnh nhân độc lận với nhan, 
cho nên phương sai của ¿ (viết tắt là z? } chính là tổng phương sai của hai nhóm: 

s° = g” + g =247.77 + 61,62 = 309.39 
Do đó, độ lệch chuẩn của ¿ỉ là: 


đu =4? +ực =x/309.39 =17.50 
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Và sai số chuẩn của rỉ là: 


sẽ, = 24 NT. Ti _ HT" Họ 
H„ 


=326 


Kiểm định ¡ được tiớc ti bằng cách lấy độ ki hiệt trung bình (d4) chia cho 


sai số chuẩn của (SE): 4 66 
/m =12013 
SE, 326 


Để biết trị số f có ý nghĩa thống kẻ hay không, chúng ta phải so sánh trị số này 
với trị số của phản phối í với bậc tự da 29 + 30 - 2 = 57. Theo phản phối t, trị 
số lí thuyết này là #;„„ „; = 2.00 (trị số này có thể tra băng các phần mềm thống 
kẻ). VÌ trị số f quan sắt từ mẫu cao hơn trị số í lí thuyết (2.03 > 2.00), chúng ta cỏ 
thể phát biểu rảng sự khác biệt về lysozyme giữa hai nhóm bệnh nhân có ý nghĩa 
thống kê (statistically signiicant}]. 


Nghiên cửu trên đây dựa vào mẫu với 58 đối tượng của hai nhóm. Trong thực 
tế, chúng ta không biết chỉnh xác độ khác biệt lysozyme của tất cả bệnh nhân với 
luết tiêu hỏa và nhóm đối chứng. Nhưng chúng ta có thể ước tính độ khác biệt 
đó bằng cách ước tỉnh khoảng tin cậy 95% như sau: 


đd+ÃE„ Xinyxa; = 6.63 + 3.26 x 2.00 = 0.11 đến 13.15 


Nói cách khác, khuảng tin cậy 95% của độ khác biệt giữa hai nhóm Á và P 
dao động từ 0.11 đến 13.15 mg/L. Vi khoảng tin cậy 95% lửn hơn Ũ nên chúng 
ta có cơ sử để phát biểu rằng độ khác biệt về lysozyme giữa hai nhỏm có ý nghĩa 
thống kẻ. 


10. Kiểm định t cho “nghiên cứu trước - sau” (before - after study} 


Nhiễu nghiên cứu lâm sàng được thiết kế theo dạng “trước - sau” tức là bệnh 
nhân được theo dỗi trước và sau khi được điểu trị. Tiêu chỉ quan trọng trang 
các nghiên cứu nảy là sự thay đổi ở từng bệnh nhân. Vấn để đặt ra là sự thay đổi 
này có ý nghĩa thống kẻ hay không. Phương pháp phân tích (hay so sánh) để giải 
quyết câu hỏi này vẫn là kiểm định t, nhưng là kiểm định t tửng cặp mà thuật 
ngữ tiếng Anh gọi là paired t-test. 

Ví dụ 10: Nghiên cửu sau đây đa lưỡng nỗng độ creatinine (nm/min} trước 
và sau khi giải phẫu của 6 bệnh nhân (BN) được gây mẽ bằng thuốc halathane. 
Chúng ta muốn biết nẵng độ creatinine thay đổi theo chiếu hướng nào và cỏ ý 
nghĩa thống kê hay không. 
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Bảng 6. Creatinine ở 6 bệnh nhân trước và sau khi giải phẫu 


C—— TT NIƑ NI [TM SG. 
Tâm 


Sanh | p [am am | m— 


Gọi đ, là mức thay đổi creatinine sau khi giải nhẫu cho bệnh nhẫn ¡ Í¡ = Ì, 
1,..., 6}. Gọi đ là ước số trung bình của đ,. Nếu thuốc halothane làm thay đổi 
nắng độ creatinine thì chúng ta kì vọng rằng đ sẽ là Ũ (hay không khác với 0). 
Vì vậy, trả lời câu hỏi trên cũng có nghĩa là kiểm định giả thiết đ = Ú với giả 
thiết đ # Ũ. 

Ước số trung bình của ở, là: 


đc. 20I+—18 -243 


Độ lệch chuẩn của z, cũng có thể tiớc tính từ số liệu trên: 
s=a4j(39—24.3) +(4—24.3} +...+(—18—24.3}” !5=42.2 


Và sai số chuẩn của đ là: 
Ä 4232 


—=—= -1T2 


Do đả, trị số có thể được ước tính như sau: 


dử _ 43 _ 
—øE 112. 


Với số mẫu 6 bệnh nhãn, trị số í„„.„ theo phân phối í là ¡„., = 2.57. Nhưng 
trị số † quan sát là 1.41 (thấp hơn trị số lí thuyết), cha nên chúng ta phải kết luận 
là mức độ thay đổi về creatinine trước và sau giải nhẫu không có ý nghĩa thống kẻ. 

Một cách khác để kiểm định giả thiết trên là ước tỉnh khoảng tín cậy 859%, 
Với đ = 24.3 và sai số chuẩn SE = 17.2, khoảng tin cậy 95% là: 24.3 + 2.57 x 
17.3 = -20 đến 68.6 nm/min. Nói cách khác, độ creatinine sau khi giải phẫu cỏ 
thể thấp hơn trước khi giải phẫu 20 nm/min đến cao hơn trước khi giải phẫu 
68.6 nm/min. Với sự bất định như thế, chúng ta không có bảng chứng để kết 
luận cỏ sự thay đổi creatinine trước và sau giải nhẫu. 
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11. Hệ số tương quan 


Hệ số tương quan (coeflicient of carrelaton), như tên gọi, phản ảnh mức độ 
tương quan giữa hai biến liên tục. Hệ số tương quan được biết đến bảng nhiều 
thuật ngữ như Pearsons currelaHian cueflicieni, hay pruduri-manrmenf carrelafinn 
cnefiticienf}, và theo qui ước chung, kỉ hiệu của hệ số tương quan là r (viết thưởng). 

Giá trị của r dao động trong khoảng 0 đến |1|. Nếu r > ñ (Biểu đồ 2A, 2B) thì 
hai biến X và Y cùng biến chuyển theo một chiếu hướng. Nếu r < ñ (Biểu để 2D, 
2F) thì hai biến X và Y biến chuyển theo hai hướng nghịch nhau (khi X tăng thì 
Y giảm). Nếu hai biến X và Y có r = ñ (Biểu đồ 2E), thi hai biến không có liên 
quan nhau. Giá trị |r| càng gần I là tín hiệu cho thấy hai biến có liên quan cảng 
chặt chẽ. 


Hình 3. Hệ số tương quan giữa X và Y 


Trên đây là một số thuật ngữ, khải niệm, và phương pháp phản tích thống 
kẻ rất phổ biến trong y văn và y học thực chứng. Vì mục tiêu là giải thích, nên 
tôi không đảo sâu vào chỉ tiết toán học đằng sau các phương pháp tính toán. Tôi 
nghĩ răng đọc qua các khải niệm và nhương pháp này, các bạn sẽ không củn hữ 
ngũ với các bài bản y học nữa. 
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Ghi chủ kĩ thuật 
Mã R cho Hình 1 (Mật độ xác suất chiểu cao với trung bình 163.3 và độ 


lậch chuẩn 6.6.) 


helght = seq(140, 150, 1J 
Elot (heinht, dnorm(helnht, 163.3, 6G.bB], 

type=”1”, 

ywlahb=”Erohahlllity”, 

xlah=”He1qht”; 

mạ1n=”Erohahlllity d1str1hbutldn öÈŸ he1I1gqht 1n Vietnamese 
mẽn”} 


Tô đậm điện tích đưới đường biểu diễn 


helght = seq(14, 15, 1J 
dht = dnorm(helght, 163.3, 6.B} 
hÈt = data. frame [z=helinht, ht=dht) 
zœ = lhũ 
blot (ht, 
tựpe=”n”, 
yLabh=”Erohbah1lllity”; 
xlab=”He1qnht”; 


ma1n=”Erohahlllitw d1strl1hutlon öf£ hel1gqhtE 1n WŸ1ietnamese 


man ” ] 


t = nuhget (ht, z«<= zc] 
EolLyqen [c (rev [t§z}„, t§z], 
c({rep(ũ, nrow(t]}]}, t§ht], col=”liqghthbhlue”, border=NA) 
11nẽs [Ht, Lwd=z] 
arrowa [14H,ñ.Ũ1,143H,ñ.002, anqle=3l, length=ũ. 1] 
text (135,0.012, "“EF{X < 150) = 1.BW%"”, cex=ũ,BR) 


Mật độ xác suất của phản phối chuẩn, với trung bình (ì và độ lậch chuẩn 1 


zhelqht = seqli-34, 4, 0ñ.Ũ1} 

dzht = dnorm[zhelqght, D, 1} 

mht = data.,frame [z=zhelqht, ht=dzht} 
PlLot (zht, 
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type=”n”, 
ylahb=”Prohahlllity”, 
xiab=”j# qcore”;, 


maạ1n=”Erohbahlllity d1strlbutlon ö£ z heiqht 1n Vietnamese 
mẽn”} 


zl = 1.E5 
z¿ = -l.b¬ 
z3 = 1.56 
zÄ = -l.3B 
sh = z¿.5H 
“sẽ = =2.5H 


tl = nuhaetlzht, z>= z1) 
Eolvqen {c (revw(t1l§z}, t1§z], 

C [reP[, nrow(t1l)), t1ISht}, col=”"liqghthlue”}) 
t2 = nauhasetlzht, z<= z2) 
Eolvqeon Í[c (revw(t2§$z], t25z}]„ 

CÍreP[, nrow(tzZ)})„, t/Sht},g col=”"liqghthlue”}) 
t3 = nauhaetlzht, z>= z3) 
Eolydqon [c (rev(t3S$z), t31§z], 

C [rep[Ũ, nrow(t3)), t31ÿShL},g col=”"liqghtpink”}) 
tả = nauhsetlzht, z<= z3) 

Eolvqon Íc (rev(ta4Sz), t4§z]„ 

C[rep (ũ, nrow(td]}], tÄ3Sht), col=”"l1Inqnhtpink*”]} 
th = nuhsetlzht, z>z= z5] 

Eolvdqon Íc (revw(t5$z], t5§5z], 

C [rep (ñ, nrow(t5]], t55ht},g col=”lavender”) 
thủ = qauhsetl[zht, z<= z6] 

Eolvdqon [c (revw(tb$z}], t6§z]„, 

CÍ[rep (, nrow(t6]}], t6Sht}, col=”lavender”]} 
11nes [zht, Lwd=z) 


arrowaÍ[-l.b65,0.1,1.65,0.1, angqle=3Ũ, length=ũ.l, coöode=l, 
1ty=z] 


text(,.11, "“P{-1.645 < z < 1.6485] = Ú.8”, cex=0.HJ 


arrowa [=1.93b,0.05,1.56,0.0ñ5, angqle=31D, lenqth=Ù.l, coda=3, 
1ty=2] 
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text (I,0.6, “*P(-1.36 < z < 1.56} = Ú.95”, cex=0.E} 


arrowa [=z2.58,0.01,2.58,0.01, angqle=34U, lenqth=l.,l1l, coade=3, 
1ty=2] 


teaxt(1,0.02, “Ei-2.57b6 < z < 2Z.5/b} = U.H33”, cex=i,BH] 
Mô hình hồi qui tuyển tính đơn giản (xí dụ 11) 


weight= c(51l, 66, 47, 54, Bá, T5, 54, 52, 53, 52, 4B, 4B, 
63, 40, 30] 


waist= cÍ71l, B1, 64, T4, B7, 33, 66, T4, 75, 72, TŨ, BB, BI, 


57, S4) 
dat = data.frame (welIight, wal1st] 
r=q = lm{walst —~ welght, data=daL] 


ElLot (walst - welght, PpCh=lb, xlab=”Nelqht”, ylah="Nalst 
C1rCumference” ) 


ahl1ne [redq] 
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NHỮNG KHÁI NIỆM Cũ BẢN 
VỀ THŨNG KÊ 
PHÂN II: CÁC MÔ HÌNH PHÂN TÍCH 


12. Mô hình hỗi qui tuyến tính 


Mỏ hình hỏi qui tuyển tỉnh (linear regression model) là một triển khai từ 
phãn tích tương quan. Phản tích tương quan có mục đích chính là ước lượng 
mức độ liên quan tuyến tính giữa hai biến liên tục. Mô hình hổi qui tuyến tỉnh 
(sẽ viết tắt là H(TTT}) có 3 mục đích chính như sau: 

s® tiớc lượng và đánh giả mối liên quan giữa hai hay nhiều biến; 

s xây dựng mỏ hinh tiên lượng; vả 

s kiểm soát ảnh hưởng của các biến nhiễu trong nghiên cửu quan sắt. 

Mô hình HỢTTT có lẽ là một trong những phương pháp phần tích thống kế 
phổ hiển nhất, được áp dụng nhiều nhất (và cũng hị lạm dụng nhiều nhất] truong 
nghiên cứu y học. Mô hình nảy có một lịch sử khá lầu đời. Năm 1885, nhà khoa 
học gốc Anh, Francis Galton (một trong những nhà khoa học tiên phong trong 
di truyền học) giới thiệu khái niệm “regression” (hỗi qui) trong một nghiên cứu 
mả trong đỏ ông chứng minh rằng chiếu cao của những người cũn không có xu 
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hưởng tương quan với chiểu cao của cha hay mẹ, mả có xu hướng tương quan 
với chiều cao trung bình của cha và mẹ. (ng gọi xu hướng nảy là hồi qui. Nhưng 
thật ra, (zalton không phải là người đầu tiên phát triển, mà là người đấu tiên ng 
dụng. mỗ hình hỗi qui tuyển tỉnh. Nhà toán học “huyển thoại” người Pháp tên 
là Adrien Marie Legendre mới là người đấu tiên phát triển và cũng hồ công trình 
nghiên cứu về hỗi qui tuyến tính vào năm 1805 (nhưng lúc đó öng không dùng 
danh từ “regression”). Nhưng người cỏ ý tưởng nguyễn thủy về hổi qui tuyển 
tính là Carl FEriedrich Gauss (một nhà toán học thuộc vào hạng huyển thoại 
khác), người từng để cập đến khái niệm hồi qui vào đầu thế kỉ 119. 

Mỏ hình HỢTTT phát biểu như sau: Gọi p, là đo lưỡng của đổi tượng ï (¡ï = Ì, 
3, 3,..., n} của một biến phụ thuộc, và x, là đo lường của một biến độc lập cũng 
của đổi tượng ¡, mỗi liên hệ tuyến tỉnh giữa hai biển có thể mỗ tả băng phương 
trinh với hai thông số a và b như sau: 

,=q+jñx,+ẽ, 

Trong đỏ, a và b là hai thông số của mỗ hình hỗi qui tuyển tỉnh cẩn tiớc tỉnh 
tử số liệu quan sắt được, và z, là phần dư, tức phần không thể tiên lượng bảng đo 
lường của biển số độc lặp. Mô hình trên chỉ hợp lí khi các giả định sau đây đúng: 

(ï) Giá trị của x không chịu ảnh hưởng sai số đo lưỡng (random error); 

(ii} £; tuần theo luật phân phối chuẩn với trung bình 0 và phương sai ø”; 

(ii) e, không có tương quan gì với x; và 

(iv} các giá trị nối tiếp của z, (chẳng hạn như ø; và £;) độc lập với nhau. 

Để ước tính 2 thông số a và b chúng ta cẩn phải có dữ liệu thực tế. Với dữ liệu 
thực tế, nhà nghiên cửu có thể dùng phương pháp bình phương tối thiểu (least 
sauares method) để ước tính hai thông số đả. 

Vỉ dụ I1, cản nặng và vũng eo: Chúng ta có số liệu về cần nặng và vủng eo 
của 15 đổi tượng như sau. Mục đích là chúng ta muốn ước lượng mỗi tương 
quan giữa cẵn nặng và vòng cú. Câu hỏi kế tiếp là nếu chúng ta biết được cần 
nặng, chúng ta có thể tiên đoản vòng eoŸ 
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Bảng 1. Căn nặng vả vòng eo của 15 người Việt 


Gọi vòng eo là Y và cân nặng là X, chúng ta có thể phát hiểu răng vòng eo của 
một cả nhân bằng một hãng số cộng với một hệ số liên quan đến cản nặng, và 
một sai số ngẫu nhiễn z: 

Y=n+fX+e 


Trong đó, a gợi là imfercepi, là piá trị của Y khi X = Ú; Ê là slope hay gradient 
(độ dốc} có liên quan đến X, Sai số ngẫu nhiên e được giả định răng tuần theo luật 
phân bố chuẩn với trung bình 0 và phương sai là bất biển cho tất cả giả trị của X. 

Dĩ nhiên, chúng ta không hiết ä và , nên phải ước tính qua nghiên cứu. Gọi 
qä là ước số của a, và b là ức số của . Dùng nhân mềm R, chúng ta có thể tiớc 
tính thông số a = 29.86 (làm chắn 30) và b = 0.80. Nói cách khác, phương trình 
hay mỗ hình để tiên lượng vòng eo từ cần nặng lả: 


Vòng eo = 3Ú.Ũ + ñ.ãŨ x Cần nặng 
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Ý nghĩa của phương trình nảy là gi? Ở đây, giá trị a = 30 không có ý nghĩa 
thực tế gì đáng kể. Nhưng b = 0.80 có nghĩa là mỗi kg cân nặng tương quan với 
.8 cm vòng eo. Một số người diễn giải cho đề hiểu [nhưng không chích xác] là 
khi cần nặng tăng 1 kg thi vũng eo tăng 0.80 cm. Do đó, nếu một cả nhắn có cần 
nặng 5Ũ kg, chúng ta có thể đoán rằng vòng eo của cá nhân này là khoảng 70 cm 
(30.0 + 0.80 x 50). Cá thể thể hiện mỗi liên hệ giữa căn nặng vả vùng eo qua biểu 
đồ dưới đảy. 


= 
ỗ 
Eñ 
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E 
§ 
3 
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SA 
= 
=1 


4ũ 50 B0 rũ 8ũ 80 
Weiaht 


Biếu đã thể hiện mối liên quan giữa cân năng [trục hoành] và vòng eo [trục tung]. 
Đường thẳng chỉnh là đường hồi qui tuyển tỉnh [ Vòng eo = 30.0 + 0.80 x Căn năng]. 

Suy luận từ mỏ hình HOTTT chủ yếu tập trung vào thông số B và hệ số xác 
định. Nhìn qua mỏ hình Y = a + BX + z, chúng ta thấy nếu ỗ = Ö thi Y chỉ là một 
hãng số [số trung bình] cộng với sai số ngẫu nhiên z; nói cách khác, không có 
mỗi liên quan giữa Ä và Y. Do đó, giả thuyết vô hiệu H, đặt ra là: 

H;8=0 

Để kiểm định giả thuyết H,, chúng ta cần tính sai số chuẩn của ước số b (nhớ 
răng b là ước số của B). Trong ví dụ trên, sai số chuẩn của b là 0.092. Do đỏ, kiểm 
định ? được tỉnh: — B080 - 

SE(b)_ 0.092 
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Giá trị t = 8.69 tức cao hơn í = 2. (ngưỡng của giả thuyết H,), nên chúng ta 
có chứng cứ để bác bỏ giả thuyết H,. Thật ra, trị số P = 0.00000089 có thể tỉnh 
hãng phần mềm R. Nói cách khác, mỗi liên quan giữa vòng cũ và cần nặng là có 
Ý nghĩa thẳng kẽ. 

Hệ số xác định (coefiicient of đetermination}, thường được kí hiệu là R*, là 
hệ số được tỉnh toán từ mỗ hình HỢỚTT. Trong vỉ dụ trên R? = 0.85, có nghĩa là 
85 phương sai của vòng eo có thể giải thích bởi cần nặng. Với một số giả định, 
hệ số xác định càng cao mỗ hình cảng tốt. Cần lưu ý răng căn số hặc 2 của R? 
chính là hệ số tương quan (xem mục Ï 1), và trong vỉ dụ nảy, r = 0.824. 

Mô hình hổi qui tuyển tính đa biến 

Mỏ hình HỢTTT như mỗ tả trên có một biến tiên lượng X, nhưng trong thực 
tế mỏ hinh có thể mở rộng để có nhiều biến tiễn lượng và trong trưởng hợp đá 
mỏ hình cỏ tên là mỏ hình hồi qui tuyến tính đa biến (multinle linear repressinn}. 
Nếu chúng ta có p biến tiền lượng, mỗ hình HOTT đa biến là: 


Y =a+ Xi + B2 + B3Xã +... DpXp + 


Như có thể thấy, mỗ hình có p+1 thăng số (tức a, B,„ ., B„›... B1. Phương 
pháp ước tỉnh các thông số vẫn là bình phương tối thiểu và dựa vào dữ liệu thực 
tế. Tuy nhiên, điễn giải các thông số thi có phần phức tạp hơn mỗ hình HỢT”T 
đơn giản. 

Ví dụ 12: Độ tuổi, cân nặng, và huyết áp. Miột nghiên cứu tìm các yếu tổ có 
liên quan đến huyết áp được thực hiện trên 12 đối tượng người MT. Dữ liệu về 
giới tính, độ tuổi, cân nặng (kpg], và huyết áp tâm thu (mmHg) của 12 đối tượng 


như sau: 


ID Sex Age — Weipht BP 
1 Ũ h2 ;R.h 132 
3 ũ 59 831.5 143 
3 l 67 88.0 153 
4 l 3 gh./ lã2 
5 | 4 &R.g 154 
ũ ũ 4 G_,8 lñã 
# | 54 853 13z 


8 ũ 61 85.3 149 
g l ñ5 831.9 159 
lũ ũ 4ñ /¬.ñ 128 
H1 l rư› 98.4 lñõ 
12 ũ q5 80.8 140 


Mục tiêu nghiên cứu là xác định ảnh hưởng của độ tuổi, giới tỉnh, cân nặng 
đến huyết áp. và qua đó hi vọng xảy dựng một mỗ hình tiên lượng huyết áp dựa 
vào các biến độc lập. Để viết tắt, gợi 
Y là huyết áp; 

" ' 4 là độ tuổi; 


s« 4X là cần nặng; và 

« X là giởi tính. 

Mô hình HỢTT đa biến phát biểu như sau: 
Y=a+BX +ŨX+PX tế 


Với giả định như trên: £ độc lập nhau và tuân theo luật phản hố chuẩn, với 
trung bình ñ, phương sai bất hiến. Dùng R (xem chỉ tiết kĩ thuật phần Ghi chủ) 
để ước tỉnh các thông số trên, chủng ta có một kết quả như sau: 


Coe fficients: 

Estimate ã=td, Error tưaluc Er(>|t|] 
(IntercepL} 15.8311 11.4748 1.385 ũ.20345 
aqe ũ.5382 ñ.1888 +.840 ñ.02182 * 
weiqhE 1.,13580 8.2328 4.888 ũ.00121 ** 
an. actor [sex]l =ũ.23131 1.H1á& =ñ.,162 ũ.87570 


Siqnif, codens;  '**#+*? Q,D001 "***? 0,01 °**/ 0,05 *.' ñ.1 * 7 1 
Rcesidual standardi crror: 2.624 ñn 8 doqreecs nñf freedom 
Multiple E-squared: ñ.937118 


Dựa vào các ước số trên, mỏ hình tiên lượng huyết áp có thể viết như sau: 
Y=l15.9+0.53X, + 1.14X - 0.29(nữ) + z 
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Chủ ý phương trình trên không có giới tính nam. Lí do là hệ số liên quan đến 
nam giới được mặc định là ñ, và do đỏ, hệ số liên quan đến nữ thể hiện sự khác 
hiệt miữa nữ và nam. Phương trình trên cỏ thể viết lại cho từng giới tính như sau: 


Đối với nam: 
Y=15.9+0.53X, + L.14X, 

Đổi với nữ: 

Ÿ =l59+U53X,+lI.l4X,- U29 
=15.6 + 0.53X, + 1.14X, 

Kết quả trên cho thấy sự khác biệt về huyết áp giữa các cá nhãn chịu sự ảnh 
hưởng của độ tuổi (P = 0.02) và căn nặng (P = 0.001). Khi độ tuổi tăng 1 năm thì 
huyết áp tăng 0.54 mmHg. Ở hất cứ độ tuổi nào, khi căn nặng tăng 1 kg thì huyết 
áp tăng 1.14 mmHg. Phương trình cũng cho thấy nữ giới có huyết áp thấp hơn 
nam là 0.29 mmHHg, nhưng độ khác biệt này không có ý nghĩa thống kẻ. Hệ số 
xác định (R*) cho biết 3 yếu tổ (tuổi, cân nặng, và giới tính) giải thích 97% 

Vì giới tỉnh không có # nghĩa thống kê, nên chúng ta có thể loại hỏ khỏi mỗ 
hinh, và mỏ hình mới l: 


Y=16.8+0.54X + 1.12Ä, 


CoeTficlienLs: 

lạqE1maLe Std. Error L value Pr [>|tl} 
(InELercepL}] 16.79H4 8.4188 1.778 0.10914% 
aqeœ ũ.5ä2+? .1742 1.1nh Ũ.012413 # 
wf©:1qhHLE 1.1214 ñ.1971 5.6H8 0ũ.000298% #~#* 


mIqn1f, Cñden: Ù °*#*4*/ QUD001I **4*/ DỐI **/ 0,05 *,' 0.1 ° ? 1 


Regidual søtandard error: 34.478 on # doqreen on frecdom 
Multlple E-squared: 0.9717 


Chủ ý các thông số của mỏ hình mới có khác biệt với mỗ hình cũ, nhưỉng sự 
khác biệt không đáng kể. Hệ số xác định vẫn 979. Mô hình này ứng dụng cho 


cả nam vả nữ. 


13. Mô hình hổi qui logistic 


Trong mỏ hình HOTT: hiển nhụ thuộc (Y) là một biến liên tục. Khi hiển 
phụ thuộc là hiến nhị phân (hinary variable), tức chỉ có 2 giả trị, thì mỏ hình 
HỚTT không thể áp dụng; trong trưởng hợp đỏ, chúng ta cần sử dụng mỗ hình 
hỗi qui logistic (hay Íngisfic regressinn maicl). Cũng như mô hình HOTTT,; trong 
phân tích hỏi qui logistic, biển tiên lượng hay biến độc lặp có thể là biến liên tục, 
nhưng cũng có thể là biến phân loại. 

Để hiểu mỏ hình hỗi qui logistic, chúng ta cẩn phải điểm qua khái niệm ñdds 
và logit. Nếu P là xác suất mắc bệnh, chúng ta biết rằng øds mắc bệnh được 
định nghĩa là: ` 

txhš=——— 
I-P 

P có giá trị từ 0 đến 1. Do đó, odds có giá trị từ -ss đến «. Để mô hình có ý 
nghĩa thống kẻ vả tiện cho việc mỗ hình hóa, một hoán chuyển khác cẩn phải áp 
dụng, gọi là lugif transfarmatian. Logit(P) được định nghĩa như sau: 

` P 
t(P)=|—— 
logit(P) , = z) 

Do đó, logit(P) chính lá log(ødds). Mô hình hãi qui logistic phát biểu như 

Sau: 


lx|TZ„]-z+#x +£ 
l—p 


Trang đó, lagit(P) là biến phụ thuộc; a và h là hai thông số cần ước tính từ dữ 
liệu, và e là phần dư, tức là phần không thể giải thích bằng X. Mô hình trên giả 
định răng e tuẫn theo luật nhân phối chuẩn (narmal distributHion} với trung bình 
hãng ũ và phương sai bất biến (constant variance). Mỏ hình hồi qui logistic, da 
đó, chỉ khác mũ hình HỚTIT ở hiến phụ thuộc. 


Ý nghĩa của œdds ratio (OR) và thông số B 
Chủ ý mỗ hình hổi qui logistic cũng có thể viết bàng đơn vị odds: 
Lag(ndds) = a + BX 


nói cách khác, 
ị Ì - _.r8x 
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Giả dụ đơn giản răng yếu tổ nguy cơ X chỉ có 2 giá trị (ũ là không hút thuốc, ] 
là hút thuốc}. Chúng ta có thể tỉnh odds cho hai nhóm. Nếu Ä = Ú, adds trở thành: 


thi, =e”! PP = œn 


Nếu X = ], thi 
odlds, =e”°"* 
Dao đỏ, tỉ số OR trở thành 
OR= St = = =e 


Kết quả trên cho thấy nếu chúng ta có thông số B, thi exp(B}) chính là OR. lo 
đó, OR phản ảnh mức độ liên quan giữa yếu tổ nguy cơ và nguy cơ mắc bệnh. 


Ví dụ 13: Đột qui, nóng giận, và lo lắng. Dữ liệu dưới đây trích từ một 
nghiên cửu về mỗi liên quan giữa đột qui vả hai yếu tổ nguy cơ là nóng giận và la 
lắng. Đột qui dĩ nhiên có hai giả trị được mã hỏa: Ú là không đột qui vả 1 là đột 
qui. Biến “nóng giãn” cũng được mã hỏa thành 2 giả trị “không” (0) và “có” (1). 
Biến “lo lắng” được đo lưỡng bằng một phương pháp tâm lí và là một hiến liên 
tục, người lo lắng nhiều có giá trị cảng cao. 


ID Độtquị  Nónggiận  Lolắng 


1 1 ũ ⁄ũ 
+ 1 ũ äũ 
= 1 ũ 5ũ 
4 1 l hũ 
= 1 l 4ũ 
ũ 1 l ñ5 
Fủ 1 l 5 
B 1 l 8ũ 
ụ 1 l ⁄ũ 
lũ 1 l bŨ 
H ũ ũ ñ5 
12 ũ ũ 5ũ 
13 ũ ũ 45 
l4 ũ ũ 35 
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15 ũ ũ 4ũ 
lỗ ũ ũ >ũ 
17 ũ l ¬ã 
18 ũ l d5 
19 ũ l >ũ 
+0 ũ l BÓẾ) 


Giả dụ chúng ta muốn xác định mỗi liên quan giữa nóng giận và đột quị. Gọi 

xác suất đột qui là và nóng giận là X,, mô hình hồi qui logistic phát biểu: 
Logit(P) =a+ B4, 

Phương nhắn tức tính thông số a và thường được sử dụng là phương pháp 
maximum likelihood (khả đi tối đa). Tạm gọi tiớc số của a và B lần lượt là a và bh. 
Có thể dùng nhắn mềm R (xem chỉ tiết kỉ thuật nhân (:hi chủ) để ước tỉnh thông 
số của mỗ hình trên, và kết quả là: 


CoeTfictenrs: 
EätL imaLe Ltd. Error  z value EFrf{>lzl} 
(IntcercepL}] -ñũ.6531 ũñ.7071 -. 9RŨ 0.5327 
anqer 1.3528 ũ.93ảá9 1,326 .185 
(ñlnherailon parameLer for hinoamial family taken to be 1} 
Hull devwiance : J!.,71232b ñn 18 denqreeg o[ ÍỨreecdom 


Regidual deviance : 25.H7/H am 18 deqreeg nñ[ Ứreerdom 


Với kết quả phản tích, chúng ta có thể viết phương trình tiên lượng như sau: 
lng li) =-0.60+1.251, 
I-P 

Thông số mà chúng ta quan tắm là b = 1.35. Như giải thích ở trên, OR = 
exp(1.25) = 3.49. Nói cách khác, kết quả này cho thấy odds bị đột qui ở người 
nắng giận cao gấp 3.5 lấn so với odds đột quị ở người không nóng giận, nhưng 
ảnh hưởng này không có ý nghĩa thống kê (P = 0.185). Chúng ta cũng có thể tỉnh 
khoảng tin cậy 95%ú hãng cách dùng sai số chuẩn trang bảng kết quả trên: 


exp(1.25 — 1.96 x 0.94) = 0.55 
cxp(1.35 + 1.96 x .94) = 22.0 
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Mô hình hồi qui logistic đa biển 


Trong ví dụ trên, chúng ta chỉ có một biến tiên lượng (X ), và biến tiên lượng 
là một biển nhị phân. Nhưng mö hình trên cũng có thể mở rộng cho nhiểu biến, 
kể cả biến liên tục. Chẳng hạn như chúng ta muốn xác định ảnh hưởng hiến “lo 
lắng” (anxiety, kí hiệu X_} và biến “nóng giận” (kí hiệu X_} trong cùng một mỗ 
hình. Mô hình hổi qui logistic đa biến bảy giờ trở thành: 

LogitP) =a +, X +. 
và kết quả phản tích với phẩn mềm R (xem chỉ tiết kỉ thuật phần Ghi chủ): 


CoefficlIenLs: 

IELimat-e SLq. EFFTOF z walue Pr{>zlz | ] 
{InrercepL} _1.3875H 3.27866 _3.2113 ũ.02423 *# 
anger 1.02411 1.17101 Ũ.8175 0.3818 
anxieLy ũ.118ñ4 ũ.05487 2.165 ũ.0304 *# 


mIaHIÊ, co#degi Ô **#*7 0,UOI "#** ĐD,Ụ01 *** Đ.05 °*,* 0.1 ` ? 1 


(D1nRersinn parameLrer [or hinnmial familw taken to be 1} 
Hulil devwiance :¡ 47.7236 on 19 deqrees öF frecedom 


EResidual đdejáviance : 18.B20 on 17 doqreens öf frecedom 


Kết quả trên cho thấy nguy cơ đột qui có liền quan đến lo lắng (P = 1.03), với 
R = expÍ0.1 19) = 1.13. Nói cách khác, mỗi đơn vị tăng về lo lắng thì adds đột 
qui tăng 13%. Nhưng ở đây, hiển lo làng là một hiến liên tục, với giả trị từ 35 đến 
8Ú. Da đó, thay vị tỉnh ÖR trên 1 đơn vị, chúng ta có thể tỉnh trên lũ đơn vị: 


ÖR = exp(0.119 x 10) = 3.29 


Kết quả trên cho thấy cử lo lắng tăng 1ũ đơn vị thi odds đột quị tăng khoảng 
3.3 lần. Chúng ta cũng có thể tỉnh khoảng tin cậy 95% cha ÔH: 


exp(0.118 x 10 - 1.96 x 0.055 x 10} = 1.12 
exp(ũ.119 x 10 + 1.96 x ñ.055 x 10) = 9.66 


Kết quả trên còn khẳng định ảnh hưởng của nóng giận không có ý nghĩa 
thống kẻ. 
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Mỏ hình hỗi qui logistic không có hệ số xác định RẺ, vi không có phương sai 
(variance). Tuy nhiên, mô hình hổi qui logistic có chỉ số deviance. Có thể xem 
deviance như là phân dư (residual) trong mỗ hình hồi qui tuyến tỉnh. Theo đỏ, 
mỗ hình phản ảnh dữ liệu thực tế cảng tốt, deviance cảng thấp. 


Chẳng hạn như trong bảng kết quả trên cho thấy khi không có biến nào trong 

mỗ hình thi deviance là 27.726 (còn gọi là nuÏÌ deviance}. Khi mô hình có 2 biến 
(nóng giận và là lắng), deviance mảm xuống củn 1B.§2. Một số người tỉnh chỉ số 
pseudo-R> tử deviance, vỉ dụ: 
27.726 —18.82 
“.= 
và diễn giải răng hai hiển tiên lượng giải thích 32% phương sai của đột qui. Tuy 
nhiên, cách tính cũng như cách diễn giải này không được chấp nhận rộng rãi 
trong cộng đẳng thẳng kẽ học. 


naeudn= R” = =032 


14. Phân tích sống còn: phương pháp Kapnlan-Meier 


Trong nhiễu nghiên cứu lắm sàng, nhà nghiễn cứu không chỉ quan tắm đến 
biến cổ lâm sàng xảy ra, mà còn quan tâm đến thời gian biến cố đỏ xảy ra. Chẳng 
hạn như 3 bệnh nhản ung thư củng tham gia vào một nghiên cứu, nhưng nếu 
bệnh nhãn thử nhất tử vong sau 6 tháng điểu trị, và bệnh nhân thử hai tử vong 
sau 3 năm điểu trị thi đỏ là một khác biệt đáng kế. Yếu tổ thời gian làm cho nhân 
tích có phần phức tạp hơn. Chúng ta đã thấy mỗ hình HOTTT có biến phụ thuộc 
là biến liên tục, mỗ hình hỗi qui logistic có biến phụ thuộc là nhị phản hay cũng 
củ thể xem là biến cố. Cả hai mỗ hình HỢTTT vả lagistic không thể dùng để nhân 
tích dữ liệu với outcome là thời gian. Chúng ta cần một phương pháp khác, và 
phương pháp đơn giản nhất là phương pháp Kaplan-Meter. 

Khải niệm Censored. Phương pháp Kanlan-Meier (KM) ước tỉnh tỉ lệ sống 
sót tích lũy (cumulative survival probahility} của các đối tượng trong nghiên cửu. 
Để hiểu phản tích sống còn, chúng ta cẩn phải làm quen với khải niệm censoreri 
Có thể định nghĩa khái niệm censared như là một quan sắt không đẩy đủ da các 
nguyên nhân ngẫu nhiên, và nguyên nhân censnred phải đặc lập với biến cổ mà nhà 
nghiền cửu quan tầm (nutcame). 


Vĩ dụ: Một nghiên cứu về ung thư gan theo dõi một nhóm bệnh 2 năm, và 
trong thời gian theo đỗi, các nhà nghiên cứu quan sát diễn hiến lãm sảng của 
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từng bệnh nhẫn. Biến cỗ mà họ quan tắm là tử vong vì ung thư gan. Sau đây là 
vải trường hợp xảy ra: 

s Bệnh nhãn A tham gia nghiên cứu cho đến khi bà qua đời trước thời hạn 
3 năm. Trưững hựn này được xem là unremsored. 

s« Bệnh nhän B tham gia nghiên cứu chủ đến tháng 34 (tức thửi điểm kết 
thúc nghiễn cứu) và vẫn còn sống. Trường hợp nảy được xem là certsorcri. 

s«- Bệnh nhần C tham gia nghiên cửu từ đầu, đến thời điểm 1.5 năm, bà quyết 
định không tham gia nữa và rút khỏi nghiên cứu. Trưởng hợp nảy được 
xem là một censoredl nhservwafinn, bởi vì nhà nghiên cửu hiết hà sống đến 
1.5 năm (còn sau đó thì không biết). 

« Bệnh nhãn D tham gia nghiên cứu cho đến tháng thử 23 (gắn 2 năm) thi 
hị tai nạn xe và tử vong. Trưởng hợp nảy cũng được xem là censurer vì nhà 
nghiên cửu biết hả củn sống đến tháng 23 và nguyên nhẫn tử vong độc lặp 
với ung thư gan. 

Vĩ dụ trên cho thấy "censored” hay “survival” (tức còn sống) là khái niệm để 
chỉ hiến cổ chưa xảy ra. 

Phương pháp Kanlan Meier (KP). Như nói trên, mục đích của phương pháp 
KE là ước tỉnh xác suất sống cho mỗi thời điểm. Với khái niệm censoreri (hay đơn 
giản hơn là “sống”), chủng ta có thể xem qua phương phán KP qua ví dụ sau đây. 

Ví dụ 14: Sống sót ở bệnh nhân nhiễm HIV. Dữ liệu sau đây phản ảnh số 
ngày sống sót của một nhóm bệnh nhãn HIV: Những bệnh nhân có dẫu ”*” và 
được tô đậm là censored (tức củn sống). Chẳng hạn như bệnh nhân 1 qua đời ở 
ngày thử 6, bệnh nhân thứ 5 thì đến ngày 4ẽ vẫn củn sống. Số liệu của 23 bệnh 
nhän như sau: 

6, 12, 21, 27, 32, 39, 43, 43, 46, 89, 115”, 139), 181”, 211”, 217, 
261, 263, 270, 295”, 311, 335, 346, 365” 

Chúng ta có 23 bệnh nhân, và thời gian sống dao động từ 9 đến 362 ngày. Phân 
tích KP giả định răng số bệnh nhãn khởi đấu (thời điểm t = Ú]) là “at-risk” (cỏ nguy 
cơ}. Do đỏ, tại thời điểm t = Ũ, chúng ta có 23 bệnh nhẫn at-risk, và lúc đó chưa có 
tử vong, nên tỉ lệ tử vong [kí hiệu q,} là 0, và tỉ lệ sống sót [kí hiệu p | là 1.0. 

s Tại thời điểm t = 6 ngày, có 1 bệnh nhân tử vong. Do đó, q = 1/23 = 

00435, và p = Ì - 0.0435 = U.8h5únh. 
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s Tại thời điểm t= 12 ngày, nghiên cứu củn 22 bệnh nhân at-risk (vi I đã 
chết], có Ì bệnh nhẫn tử vang. Dao đỏ, q,= 1/22 = 0.0455, và p,= | — 0.0455 
= 0.8545, Đến đây xác suất sống sót tích lũy [kỉ hiệu S,] bằng xác suất 
sống lúc 6 ngày và 13 ngày: 

Š.=.9565 x U.9545 = U.9130 


s« Đến thời điểm t = 21 ngày, số bệnh nhãn at-risk là 2] người, và Ì người tử 
vong. Do đó, q,. = 1/21 = (.0476, và p, = Ú.9524. Xác suất sống sót tích lũy 
đến ngày 21 là: 

Š.=Ú.9130 x 0.9524 = U.B695 


s_ Đến thời điểm t = 27 ngày, số bệnh nhản at-risk là 20 người, và Ì người tử 
vong. Do đó, q, = 1/20 = 0.05, và p, = 0.95. Xác suất sống sót tích lũy đến 
ngày 27 là: 

S.= 0.8695 x U.95 = 0.8260 


s_ Đến thửi điểm t= 43 ngày, số bệnh nhãn at-risk là 17 người, nhưng tại thời 
điểm này có 2 người tử vong. Do đó, q, = 2/17 = 0.1176, và p, = 0.8824. Xác 
suất sống sót tích lũy đến ngày 43 là 0.6522. 


Tương tự chúng ta tính cho t = 32, 39, 43, 89, 2361, 263, 270, 31 1. Chủ ý, chúng 
ta không tính cho những thời điểm censored vì không có biến cổ. Những tính 
toản trên có thể mình họa bằng bảng sau đây (dùng phần mềm R — xem ghi chú 
kĩ thuật). Phần mểm tỉnh cả khoảng tin cậy 951, 


Xác suất sñng tại thời điểm t 


Số tử vong và khoảng tỉn cậy 95% _ me 


tại 
¬ Phần dưới Phần trên 
thửi điểm L c suất (S 


CN n 
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n | H | 1 | % | 0 | 988 —„ 
Lm | M | 1 | 046 | 045 | 08M - 
Làm | 8 | 1 | 056 | 040 | 08 —~ 


| 1 | Ì | S4 | 02 | 04m 


Kết quả phần tích trên cho thấy xác suất bệnh nhãn sống đến tháng thử 3 
(tức khoảng 89 ngày) là 84.49, và xác suất sống đến ngày 311 (tức khoảng trên 
10 tháng) là 66%. 


Cũng cỏ thể thể hiện kết quả tính toắn trên bằng biểu đỗ nổi tiếng Kanlan- 
Meier. Chú ý biểu đỗ trình bày khoảng tín cậy 95% của xác suất sống sót tại 
mỗi thời điểm. Các điểm có dấu + trên đường hiểu diễn thể hiện các bệnh nhân 
CeHs0red. 


1.0 


8 08 


SỈI 


ũ.4 


0-2 


0:0 
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Biểu đồ 3. Biểu đề Kaplan-Meier với trục tung 
là xác suất tích luy sống sút, và trục hoành là thời gian 
Phân tích trên đây chỉ áp dụng cho một nhóm bệnh nhắn. Trong thực tế, 
phương pháp KP thường được sử dụng để so sánh hai xác suất sống còn giữa hai 
nhóm hay nhiễu hơn hai nhóm. 


Vỉ dụ 15: So sánh xác suất sống sót giữa 2 nhóm. Dữ liệu sau đây mỗ tả thời 
gian sống sót (năm) của 2 nhóm bệnh nhân, mỗi nhỏm 25 người. Nhóm 1 là 
nhóm chứng, nhám 2 là những bệnh nhãn có bệnh mãn tỉnh. Mục tiêu nghiên 
cứu là so sảnh xác suất sống sót của hai nhóm bệnh nhẫn: 


Nhám 1: 12.3%, 5.4, 8.2, 12.2*, 11.7, 10.0, 5.7, 9.8, 2.6, 11.0, 9.2, 12.1%, 
6.6, 2.2, 1.8, 1U.23, 10.7, 11.1; 5.3, 3.5, 9.2, 2.5, R., 3.8, 3.0 


Nhám2: 5.8, 2.9, 8.4, 8.3, 9.1, 4.2, 4.1, 1.8, 3.1, 11.4, 2.4, 1.4, 5.9, 
1.6, 2.8, 4.8, 3.5, 6.5, 9.0, 3.6, 5.2, 8.8, 7.8, 4.7, 3.0 


Chủ ý. tất cả bệnh nhân nhóm 2 đểu tử vong. Nhóm l có 3 bệnh nhắn còn 
sống sau khi kết thúc nghiên cứu. Với các số liệu trên, chủng ta có thể ước tỉnh 
xác suất sống sút cho từửng nhóm, và vẽ biểu đổ KE (xem chú thích kĩ thuật) cha 
2 nhóm để dễ so sánh. 


ũẽ ũ.8 1/0 


ũ4 


Cum. survival probabillly 


ũ2 


ũ0 


Time 


Biểu đổ 4. Biểu dã Kaplan-Meier so sánh xác suất sống sót giữa 3 nhóm. 
Nhóm chứng dưỡng thể hiện biểu diễn bằng màu đen, 
và nhằm bệnh mãn tỉnh dường biểu diễn màu xám. 
Biểu đỗ 4 cho thấy rõ ràng rằng nhóm chứng có xác suất sống sút cao hơn 
nhóm có bệnh mãn tỉnh. Nên nhớ trục tung là xác suất tích lũy sống sót và trục 
hoành là thời gian. Da đỏ, nếu đánh đấu trục tung ở giả trị Ũ.5 và di chuyển sang 
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hai đường biểu diễn, tìm điểm giao lưu, và kẻ đường thẳng xuống trục hoành, 
chúng ta sẽ có thời gian mà 50% bệnh nhẫn sỗng sút. Biểu để trên cho thấy 
khoảng 504 bệnh nhãn nhóm chứng sống đến 8.2 năm, so với 4.2 năm ở nhỏm 
hệnh mãn tỉnh. Có thể xem độ khác biệt là một sự ảnh hưởng. 


Nhưng câu hỏi đặt ra là mức độ ảnh hưởng đó có ý nghĩa thống kế? Phương 
pháp phản tích Wilcoxon (hay có khi để cập đến là Log-rank test} có thể trả lời 
câu hỏi. Dùng nhân mềm R, chúng ta có kết quả x” = 8.Ũ và trị số P = 0.0047. Nói 
cách khác, sự khác nhau về xác suất sống sút giữa 2 nhóm là có ý nghĩa thống kẻ. 


Phương phán KE có lễ là một trong những phương pháp phản tích phổ biến 
nhất, có ích nhất trong các nghiên cứu đoàn hệ và RCT mà biển phụ thuộc là 
thời gian dẫn đến biến cổ. Các bảng sống (liie tahble) thường được dùng trong 
dẫn số học và hảo hiểm cũng dựa vào phương nháp KE Tuy nhiên, phương pháp 
KP không thể đánh giả ảnh hưởng của nhiều biển tiên lượng. Để đánh giá ảnh 
hưởng của một hay nhiễu biến tiên lượng, chúng ta cẩn tìm hiểu một phương 
pháp thống kẻ nổi tiếng khác: mỏ hình hỏi qui Cox. 


15. Mô hình hối qui Cox 


Kiểm định lag-rank là phương pháp cho phép chúng ta so sánh xác suất tích 
lũy, SỈ), giữa hai hay nhiều nhỏm. Nhưng trong thực tế, S(f} hay hăm rủi ro hay 
củn gọi là haznrrl funcHun, kỉ hiệu là hít) có thể không chỉ khác nhau giữa các 
nhóm, mả củn chịu sự chỉ phối của các yếu tổ khác. Vấn để đặt ra là làm sao ước 
tính mức độ ảnh hưởng của các yếu tỗ nguy cơ (risk factors) đến hí0). 


Vào thập niên 1870, David R. Cox, giáo sư thống kê học thuộc Đại học Imperial 
Gollepe (Luän Đôn, Anh) phát triển một phương pháp phần tích dựa vào mỗ 
hình hổi qui (regression) để trả lời câu hỏi trên. Phương pháp phản tích đỏ, sau 
này được gọi là Mỗ hình hồi qui Cax (Caxs prapnartianal lazarrls madel), Mỗ hình 
Cox được đánh giá là một trang những phát triển quan trọng nhất của khoa học 
nói chung (không chỉ khoa học thống kế) trong thể kỉ 201 Bài báo vừa để cận đã 
được trích dẫn hàng vạn lần trong vòng 3 nắm qua. 

Hazard (rủi ro). Chúng ta cần làm quen với khải niệm hazard, vì mỗ hình 
hỗi qui Cox xem hảm rủi ro là một biến độc lặn. Hiểu hàm này không dễ vì sách 
giáo khoa nước ngoài có khi giải thích rất rắc rối. Trong ngữ cảnh phân tích sống 
củn, azard phản ảnh tốc độ tử vong của bệnh nhãn. Một cách ngắn gọn, hazard 
là độ dc (sÌnpne) của đường biểu diễn sống củn (như Biểu đỗ 4 trong phần 14). 
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Cũng có thể giải thích bằng khái niệm hazard bằng toán (cấp trung học}. Gọi 
St] là xác suất tích lũy sống sót. Ciợi FÍt] là hàm số tích lũy tử vong, tức 


FÍt} = 1 - St] 
Do đó, đạo hàm của FÍtJ, kí hiệu là ft). là hàm số mặt độ xác suất (probability 


density luncHion]: 
ft) = dE / dị 

Hảm rủi ro (hazard function)] Ä() được định nghĩa là tỉ suất biến cổ (tử vong] 
xảy ra trong khoảng thời gian t đến t + At, khi At tiến mẩn đến Ú, với điểu kiện 
hiển cố chưa xảy ra cho đến thời điểm t. Để tìm một phát biểu toán học cho hịt), 
chúng ta cẩn nhận ra rằng hít) bản thân nó là một xác suất có điểu kiện. Cần 
nhớ răng cũng thức xác suất cỏ điểu kiện là P(A | B) = P(Ax B) / P(R). Nếu gọi 
Pr(A v B) = AF/At = dF/dt, và At -> ñ, chúng ta có thể chứng mình một cách dễ 


dàng rằng: 
ñ()= dF 0 dt _ ƒ() 
sự) 3Œ) 

Thay vị viết hít). Nhìn qua công thức trên, chúng ta thấy dF là hiệu số giữa 2 
xác suất, dt là hiệu số về thời gian, và SÍt] là xác suất, nên hÍt] có đơn vị xác suất 
xác suất thời gian, hay 1/thời gian. Như vậy, hít] không phải là xác suất như chúng 
ta tưởng, mả là số hiển cỗ trong một khoản thời gian - và do đó tôi gọi là fï suất. 

Sau khi đã biết bản chất của hít), bảy giữ chúng ta có thể tìm hiểu mỗ hình 
hồi qui Cox. Gọi x.„ x., x„... T. là p yếu tổ nguy cơ. X có thể là các biến liên tục 
hay không liên tục. Mô hình Cox phát biểu rằng: 

h(r)=^2(0)z 0» 0n mshh 


hí(H được định nghĩa như phẩn trên (tức hảm rủi ro), B,, B., Ê„.... B, là hệ 
số ảnh hưởng liên quan đến mỗi hiến x, và À(f) là hàm số rủi ro nếu các yếu tổ 
nguy cơ x = Ú. À(f} có khi được gọi là baseline hazard funcHian, tức là rủi ro trung 
hình trong quấn thể. À(f) có thể ước tính từ phần tích Kaplan-Meier như mô tả 
trong phần 14. Vì mức độ ảnh hưởng của một yếu tổ nguy cơ * (—1,3,3,..., 0) 
thưởng được thể hiện hãng tỉ số rủi ro (hazarrl raiia, TR, cũng tương tự như risÌk 
ratin], hệ số cxp(B) chỉnh là HR cho khi x,tăng một đơn vị. 


Vi dụ 16: Yếu tố ảnh hưởng đến thời gian sống ở bệnh nhân ung thư bạch 
cầu (leukemia). Nghiên cửu nấm 2 nhóm hệnh nhãn: nhỏm điểu trị và nhỏm 
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chứng, mỗi nhỏm gốm 21 bệnh nhân. Thời gian sống và WBC (bạch cẩu) được 
ghi nhận ở mỗi hệnh nhãn, vả kết quả như sau: 


ID Groun Time SIatus WBC | ID Group Time Stlatus WBC 


I l ú - +31 #2 ũ l Í 32.8 
+ l ũ 1 4.06 33 ũ l Í h 
1 l ũ l 3.28 34 ũ F¿ Í 491 
4 l Ỷ# 1 4.43 35 ũ F¿ ụ 4.48 
h l lũ 1 ¿.6 Sú ũ 1 | 401 
ũ l 13 1 ¿.B8 Vg ũ 4 ụ 4_3ó 
Fủ l lá 1 3.6 +8 ũ 4 ũ +2 
8 l 12 - 2.32 KG ũ h Í 31.48 
g l 33 l VÀ. vị 3ũ ũ ñ Ỉ 1.87 
lũ l ú ũ 3.2 4I ũ hủ Ỉ 1.52 
H l ụ ũ 28 312 ũ hủ Ỉ 3.0" 
I2 l lũ ũ Là 313 ũ bì ũ 2.32 
IK) l II ũ ¿.ñ 44 ũ bì Ỉ 3.36 
l4 l 1z ũ 2.16 35 ũ I1 Ỉ 31.49 
l5 l 13 ũ ¿.05 đó ũ I1 ũ 2.12 
lỗ l 2 ũ ¿zJjm 37 ũ 12 | 1.5 
17 l 1h ũ 1.78 38 ũ 12 Í 3.06 
lễ l 12 ũ +2 49 ũ 15 Í ¿3 
19 l 12 ũ F») 4u ũ 17 ũ +85 
zũ l 34 ũ 1.47 4I ũ 22 Ỉ ¿1 
FÀI l 3 ũ ũ M3 Ỉ 1.9% 


1.45 42 


Chủ thích: ID, mã sẽ bệnh nhân; Group, nhỏm (Ú là nhóm chứng, Ì nhóm 
điểu trị); Time, thởi gian sống (tuẩn); Status (Ũ = sống (censored), Ï = chết). 

Mục tiêu nghiên cứu là nhäm trả lời 3 câu hỏi: (1) có khác biệt về thời gian 
sống miữa nhỏm điểu trị và nhóm chứng; và (2) W BC đo lúc trước khi điểu trị có 
ảnh hưởng đến thởi gian sống. 


Mỏ hình Cox có thể sử dụng để trả lời hai câu hỏi này. Gọi hít] là hàm số rủi 
ra tử vang, chúng ta có thể phát biểu răng hịt) được xác định bởi rủi ro trong 
quấn thể và hàm số liên quan đến nhóm điểu trị cũng như W BC: 

h(t}=A(t)e  Pnmauw 
Văn để là cẩn ước tỉnh hai thông số l, và B„. Ngoài ra, À(t) có thể ước tính 


hãng phương pháp Kaplan-Meier. Phần mềm R có thể dùng để ước tỉnh hai 
thông số (xem Chủ thích kỉ thuật). Kết quả phản tích là: 


CũE£ exp|coef) se(coef) z Prf>lzl! 
qroup -1.1431 0.3188 0.4606 -2.482 0.0131 k 
1.8702 b.52ñ5 ñ.,3852 4.B71 1,11lz.-0§š§ *~**# 


Siqnif, codesg;:  !**#**#*? Q,D001 ***° 0,01 °*/ 0,05 °.” 0,1 ° ° 1 


cxp(coecf)} cxp|i-cocf) lower.35 Hrnper.35 
ũñ.3188 3.1364 ũ.1253 ñ. 864 
h.52H15 .1532 34.ũ6ñ8 13.8R8ñ 


Kết quả trên có hai phần: phần đâu là tước số của thông số trong phương trình 
trên, phần 2 là hàm số mũ của ước số, tức là hazard ratio - HR. Cần nhở rằng - 
chúng ta mã hỏa nhóm điểu trị là Ì, và nhóm chứng là Ũ. Kết quả cho thấy rủi ro 
tử vang trang nhóm điểu trị chỉ bằng 32% nhóm chứng (HR 0.32, khoảng tìn cậy 
95%, 0.13 đến 0.79; P = 0.013). Ngoài ra, bất kể bệnh nhân nhóm nào, bạch cẩu 
cảng tảng cao cảng làm tăng rủi ro tử vong. Mỗi dưn vị tăng W BC làm gia tăng rủi 
ro tử vong gấp 6.5 lần (KTCS5, 3.1 - 13.9), và ảnh hưởng nảy có ý nghĩa thống kẻ. 


16. Phân tích tổng hợp: hiến nhị nhãn 

Phân tích tổng hợp (meta-analysis) là một phương pháp tổng hợp kết quả 
nghiên cứu định lượng bảng các mỗ hình phản tích thống kẻ. Mục tiêu chính 
của nhãn tích tổng hợp là đi đến một tiớc số chung cho tất cả các nghiên cứu 
trong quá khú, bằng cách cho “trọng lượng” cho mỗi kết quả nghiên cứu, và từ 
đó tính toán trung hình trọng số (weiphted average). Có thể nói răng nhãn tích 
tổng hựp là một nhương pháp cản kết quả nghiên cửu. 

Vi dụ 17: Bảng dưới đảy trình bảy dữ liệu của 13 nghiên cứu so sánh tỉ lệ 
tử vung vì bệnh suy tim giữa nhỏm bệnh nhắn được điểu trị bằng beta-hlacker 
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(BE) và nhóm chứng (tức không được điểu trị). Câu hỏi đặt ra là làm thể nản để 
tổng hựp kết quả của 13 nghiên cứu để có một kết quả chung. 


Beta-hlacker và bệnh suy tìm (congestive heart [ailure)} 


_ +” | 62 —| 

M: số bệnh nhãn nghiên cứu; Tử vong: số bệnh nhàn chết trong thời gian 
theo dõi. 

Như chúng ta thấy, một số nghiên cứu cỏ số mẫu khả nhỏ, lại có những nghiên 
cửu với số mẫu gẩn 40ÖŨ người! Câu hỏi đặt ra là tổng hựp các nghiễn cửu nảy, 
kết quả có nhất quản hay nhủ hựp với giả thiết RB làm giảm nguy cơ suy tìm hay 
không? Để trả lửi câu hỏi này, chúng ta tiến hành một phân tích tổng hợp. 


Trong phần nảy tôi sẽ mỏ tả tửng bước một để các bạn có thể phân tích một 
cách thủ công. Tuy nhiên, nếu các bạn sử dụng phần mềm R thi tốt hơn (mã R 
tôi cung cấp trong phần chủ thích dưới chương nảy). 

Bước 1: Ước tính mức độ ảnh hưởng cho từng nghiên cứu. Miỗi nghiên cửu 
củ hai tỉ lệ: một cha nhằm BB và một chủ nhỏm pÌaceho. Tôi sẽ gọi hai tỉ lệ này 
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là p, và p,. Chỉ số để đánh giá mức độ ảnh hưởng của thuốc BB là tỉ số nguy cơ 
tương đối (relative risk - RR), và RR có thể được ước tính như sau: 
RR -=.PL 
h 
bì = 
Chẳng hạn như, trong nghiên cứu 1, chủng ta có: "5E TT" U20 và 


D =..=024. Như vậy tỉ số nguy cơ cho nghiên cứu l là: RR “ng — 089. 


Tỉnh toán tương tự cho các nghiên cứu củn lại, chúng ta sẽ có một bảng như sau. 
Bảng 2a. Ước tính tỉ lệ tử vong và tỉ số nguy cơ tương đổi 


Nghiên cửu Ti lệ tử vong | — Tỉ lệ tử vong 
nhóm nÌacehbo 


(P) (p.) | 
TT | sa | 0ã6 | 08 - 
—; | mm | am | Hg. 
1 | 600 | 688 | 0388 - 
| ðH | 0 | 88.) 
T7 | øm | am | 052) 
—? | %6 | 0B | 038 - 
ý | tsB | 0S | 057 
—N | 9% | 98 | 0m - 
—n | am | 0H | 08 


Bước 1: Hoản chuyển RR sang đơn vị logarithm vả tỉnh phương sai, sai 
số chuẩn. Mỗi tiớc số thống kê, như có lần nói, đểu có một luật phân phối, và 
luật phân phối có thể phản ảnh bằng phương sai (hay sai số chuẩn). Cách tỉnh 
phương sai của RR khá phức tạp, cho nên chúng ta sẽ tính bằng một phương 
pháp giản tiến. Theo phương pháp này, chúng ta sẽ hiển đổi RR thành lag[RR] 


- 1/1 -= 
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(chú ý “log” ở đây có nghĩa là logarithm tự nhiên, tức là lng hay có khi còn viết 
tắt là ln - natural logarithm], và sau đỏ sẽ tỉnh phương sai của lag[RR]. 

Nếu N. vàN, lần lượt là tổng số mẫu của nhóm Ì và nhám UIT) và dÍ, là số tử 
vong của nhóm Ì và nhóm 2 của một nghiên cứu, thì phương sai của lop[RR] có 
thể ưức tính bảng công thức sau đây: 

¡Ũ l I I 


| Mị-dt | đ; N;-d, 
Và sai số chuẩn của log[RR| là: 


Var[logRR] = 


Trong vỉ dụ trên, với nghiên cứu 1, chúng ta có: 
Log[RR] = log (0.833) = -0.183 


Với phương sai: 
var|lũ RRị_=Ì~ x tóc =I.204 
PJ g ng g 95g - 
Và sai số chuẩn: 
SE[log R#]- xÍ0.264 0.514 


Dựa vào luật nhắn phối chuẩn, chúng ta cũng có thể tỉnh toán khoảng tin cậy 
9n của RR cho từng nghiên cứu bằng cách biến đổi ngược lại theo đơn vị RR. 
Chẳng hạn như với nghiên cứu 1, chúng ta có khoảng tin cậy 95% của log[RR] là: 


lngRR + 1.96 x SE|logRR] = -ũ.183 + 1.96 x .514 = -1.19 đến 0.82 
hay biển đổi thành đơn vị nguyên thủy của RR là: 
exp(-1.19) = 0.30 đến exp(U.82) = 2.28 
Tính tuản tương tự cho các nghiên cứu khác, chúng ta có thêm một bảng mới 


như sau. 


Bảng 2b. Ước tính tỉ số nguy cơ tương đối, nhương sai, 


sai số chuẩn và khoảng tin cậy 95% cho từng nghiên cứu 


SEJlopRR] 


ũ.842 


KICs5w% | KCI95w% 


Loạp | eĐ | 3#— 


- T = 


[ sm | 0 | 0; 
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Chúng ta có thể thể hiện RR và khoảng tin cậy 95% bằng biểu đỗ farest như sau: 


ÚI 025 Ú5 1 2# 345 1Ú 
Eelativwe risk and 351% CỊ 


Biểu dã farest thể hiện giả trị của RR và khoảng tin cậy 85%. 
Các ước tỉnh khuảng tin cây 855%0CI của RR vượt qua cột mốc Ï 
dược xem là không có ý nghĩa thống kẽ. 

Bước 3: Ước tính trọng số (weight) cho từng nghiên cứu và RR cho toàn bộ 
nghiên cứu. Biểu đỗ trên cho thấy một số nghiên cứu có độ dao động RR rất lớn 
(chứng tỏ các nghiên cứu nảy có số mẫu nhỏ hay ước số RR không ổn định). và 
ngược lại, một số nghiên cứu lớn có ước số RR ốn định hơn. Trọng số cho mỗi 
nghiên cứu (W - tôi sẽ cho vào kí hiệu ¡} để đo lưỡng độ ổn định nảy là số đảo 
của phương sai: 

——. 
var | log #Ẩ, | 


Và số trung bình trọng số của log[RR] (kí hiệu là lomwRR) có thể ước tính từ 
tổng của tích W xlag[RR ]: 
S`7,xlo,[ER] 
logwÑ#ẦÃ————————— 
Với phương sai: 


và sai số chuẩn: 2,, 


Ngoài ra, khoảng tin cậy 959 có thể ước tỉnh bằng: 
lùpg w„ÑÑ + SE [lng witR] 
Để tính trung hình trọng số logRR, chúng ta cẩn một cột W xÏag[RR ]. Chẳng 


hạn như vửi nghiên cửu 1, chúng ta cỏ: 


W=——=39 
0.264 


IẺ, xlop[ RR, | 3.70x(—0.18).3— —0.69 


Tương tự cho các nghiên cứu khác: 
Bảng 2c. Ước tính tỉ trọng số (M'} 


ấn | 2 m— 
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Chúng ta cỏ: 


3W, =3.79+0.77+...+5.75= 244.24 


5`; xlog[LRR, | = —0.69 — 0.09 +... — 4.39 = —108.42 


Do đỏ, trung bình trạng số của lag[RR]| có thể ước tính băng: 


2.,xIog[R,] _ -108.42 


lun wiÈÑ = =-Í.38 


Với phương sai: 


Var [log wRF| ———=.= 


vả sai số chuẩn: 
SE[logwRRỂ]= |_—— =-ƒ0.0035 =0.06 


Do đó, khoảng tin cậy 9594 của loøwRR cỏ thể tức tỉnh bằng: 
log wRR + SE [log wRR |= —0.38+ 1.96x0.06 =0.498 đến -0.265 


Nhưng chúng ta muốn thể hiện hãng đơn vị gốc (tức tỉ số); do đó, các ức số 
trên phải được hiến chuyển về đơn vị gốc: 


RR = exp[logwRR) = lug(—0.38) = 0.68 
Và khoảng tin cậy 959%: 
ExpÍ-0.498) = 0.61 đến ExpÍ-0.265) = Ù.77. 


Đến đây chúng ta có thể nói răng tỉ lệ tử vung trong các bệnh nhân được 
điểu trị hãng BB bằng 0.68 (hay thấn hơn 32%} so với các bệnh nhân giả dược 
(placcbo). Ngoài ra, vi khoảng tin cậy 951% không bao gồm 1, chúng ta cũng có 
thể nói, mức độ khác hiệt này có ý nghĩa thống kẻ. 
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Bước 4: Ước tỉnh chỉ số đồng nhất và bất đồng nhất. Như đã nói trong phần 
(1) liên quan đến nhần tích biến liên tục, sau khi đã ước tỉnh tỉ số nguy cơ trung 
hình, chúng ta cẩn phải xem xét chỉ sẽ Ƒ. 
Để ước tính chỉ sổ F, chúng ta cẩn tính W“(logRR,—logw#R} cho mỗi 
nghiên cứu. Chẳng hạn như với nghiên cứu 1, chúng ta có: 
H; (lop ÑR, — log w#R]ˆ = 3.79x(—0.182 + 0.38)” = 0.1502 
và cho các nghiên cửu khác: 


Ước tính chỉ số heterogeneity (F) 


T=T 
TT — 
L5 | am | sm | am 
Có [sim | xg— 
Tủ | | xã | Hân — 


Ví dụ 3 có k = 13 nghiên cửu. Do đó, 


Ẵ 
Ø=`W,(log RR, — log wRR)ˆ =11.1811 

¿=l 
Và 
' Ø-(k-I) 1118-12 


= =-0.l6 
; 11.18 


Ứ/= 
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Vì Ï < ñ, nên chúng ta có thể cho Ï° = ñ. Nói cách khác, mức độ khác biệt về 
RR giữa các nghiên cứu không có ý nghĩa thống kẻ. 

Bước 5: Đánh giá khả năng bias công bố (puhlication hias). Như đã giải 
thích trong phần trên, cách đánh giá khả năng puhÌication bias có ý nghĩa nhất 
là phân tích hồi qui đường thẳng lop[RR] và tổng số mẫu (N]: 

log[RR ]=a+bxN 
Dựa vào bảng thống kẻ sau, 


Rgmaö|JramL NT 
Ca | ap{ m— 
— TC [mm | mã 
=—“ 
mm an 
—E— | am | 
—S— | am | zm— 
Lm | am | 
.—— 
-mzr am 
Chúng ta có thể ước tỉnh a và b như sau: 
log[RR ] = -0.534 + 0.00003 x N; 
Ước tỉnh b = 0.00003 không có ý nghĩa thống kê (P = 0.78). Do đó, chúng ta 
củ thể phát biểu rằng mức độ thiên lậch về xuất bản không đáng kể trong phân 
tích tổng hợp nảy. 


Ereeisian=17SE 


Biếu dã funnel cũng cho thấy không có vấn dế publicatian bias 


Tuy nhiên, tất cả các bước phần tích trên có thể thực hiện một cách đơn giản 
và chỉnh xác hơn qua nhân mểm R mả tôi cung cấp mã phản tích dưới đây. 


17. Phân tích tổng hợp: biến liên tục 


Bối với biến liên tục, qui trình phản tích có phần đơn giản hơn so với nhân 
tích biến nhị nhân. Tuy nhiên, về cơ bản, vẫn là tỉnh effect size, tính trạng số của 
effect size, và tước tỉnh effect size chung cho tất cả nghiễn cứu. Vỉ dụ dưới đây 
minh họa cho phương pháp phân tích. 

Vĩ dụ 18: Bảng dưới đây trình bày kết quả nghiên cửu so sánh thởi gian nằm 
viện của các bệnh nhãn giữa 2 nhóm bệnh viện chuyên khoa và bệnh viện đa 
khoa. Vấn để đặt ra là các số liệu này có nhủ hựp với giả thiết bệnh nhẫn các 
bệnh viện chuyên khoa thường có thời gian nằm viện ngắn hơn các bệnh viện đa 
khoa hay không. Chúng ta có thể trả lời câu hỏi này qua các bước sau đây. 

Thời gian năm bệnh viện của các bệnh nhân đột qui 
trong hai nhóm bệnh viện chuyên khoa và đa khoa 
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Chú thích: Trong bảng này, ¡ là chỉ số chỉ mỗi nghiên cứu, ¡ = l, 2,..., 9. vả 
N, là số bệnh nhãn nghiên cứu cho từng nhóm bệnh viện; LOS, và LOS, (length 
oÍ stay): thời gian trung bình năm viện (tính bằng ngảy), SD, và 5D: độ lệch 
chuẩn (standard deyiation) của thời gian nằm viện. 

Bước 1: Ước tính mức độ khác hiệt trung bình và phương sai (variance)} 
cho từng nghiên cứu. Mỗi nghiên cứu ước tỉnh một độ ảnh hưởng, hay nói 
chính xác hưn là khác biệt về thửi gian nằm viện kí hiệu, vả tôi sẽ đặt kí hiệu là z, 
giữa hai nhóm bệnh viện. Chỉ số ảnh hưởng này chỉ đơn giản là: 


d =LOS, - LOS, 
Phương sai của dÍ (tôi sẽ kí hiệu là # ]} được ước tính bằng một công thức 
chuẩn dựa vào độ lệch chuẩn vá số đổi tượng trong từng nghiên cứu. Với mỗi 
nghiên cứu ï (¡ = 1, 3, 3,..., 9), chúng ta cỏ: 
›_ (Nụ —1)SB,+(N, —1)SDJ( LỘ 1 
ẰN,+À,_—3 Mẹ ÑW. 
Chẳng hạn như với nghiên cứu 1, chúng ta có: 


d.=75 - 55 =20 


vả phương sai của di: 
- (155-IJ(47ƒ+(1I56-I)(6@4†/ 1 - 
„li Hi hái [')-e5 
I55+156—2 155 lã6, 


hay độ lệch chuẩn: s, =x/40.59 = 6.37 


- m1 - 


Với độ lệch chuẩn s, chúng ta có thể ước tính khoảng tin cậy 95% (959 
coniidence interval hay 95%6C1) cho di bằng lí thuyết phản phối chuẩn (Normal 
distribution). Cần nhắc lại răng, nếu một biến số tuãn then định luật phần phối 
chuẩn thi 95% các giá trị của biển số sẽ năm trong khoảng +1.96 lấn độ lặch 
chuẩn. Dao đả, khoảng tin cậy 95% chủ mức độ khác biệt của nghiên cứu l là: 

củ — 1.96 x s.= 2Ú — 1.96 x 6.37 = 7.71 ngày 
đến 
đÌ + 1.96 x s = 20 + 1.96 x 6.37 = 32.49 ngày 


Tiếp tục tính như thế cho các nghiên cứu khác, chúng ta sẽ có thêm bốn cột 
trong bảng sau đây. 


Bảng 1a. Độ khác biệt về thời gian giữa hai nhóm và khoảng tín cậy 95% 
Nghiên cứu (¡] 


J1 


mg mm. 


Đến đây chúng ta có thể thể hiện mức độ ảnh hưởng PỆ khoảng tin cậy 95 
trong một biểu để rững như sau: 
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8- ——+*———- 
ở P 
T “ | _— 
ỗ = | ————% 
§- —m—. 
— “ 
§. =8 =l= 
: | -a- 
1“ —=-L 
All ghudlies L„ 
————————— 
-4J — -20 ũ zu 40 80 a0 100 


Mean differenee and 35% CI 


Biểu đổ farest thể hiện giả trị của di và khoảng tin cây 85%, 
Mức độ ảnh hưởng di ghi nhãn từ nghiên cửu 5, 7 và 8 dược xem là không có ý nghĩa thống kẽ, 
vi khoảng tin cậy 85% wượt qua cột mốc [. 
Bước 2: Ước tính “trọng số” (weight) cho mỗi nghiên cứu. Trọng số (W) 
thực ra chỉ là số đảo của phương sai z; 
W. =l1z; 
Chẳng hạn như với nghiên cứu 1, chúng ta có: H, _ns. =ũ.0246 


Và chúng ta có thêm một cột mới chủ hảng trên như sau: 
Trọng số T. cho từng nghiên cửu 


“" == 
———T- T» == 


Bước 3: Ước tính trị số trung bình của đÍ cho tất cả các nghiên cứu. Chúng 
ta có thể đơn giản tính trung bình z bằng cách cộng tất cả dj và chia cho 9, nhưng 
cách tính như thế không khách quan, bởi vì mỗi giả trị d¿ có một phương sai 
và trọng số (M⁄) cá biệt. Chẳng hạn như nghiên cửu 4, vì “M: sai cao nhất 
(150.2), chứng tỏ rằng nghiên cửu này cỏ số đối tượng ít hay độ dao động rất 
cao, và độ dao động cao có nghĩa là chúng ta không đặt “niềm tin cậy” vào đó cao 
được. Chính vì thể mà trọng số cho nghiên cứu nảy rất thấn, chỉ 0.0067. Ngược 
lại, nghiên cửu 6 cỏ trọng số cao vì độ dao động thấp (phương sai thấp) và tiớc 
tính ảnh hưởng của nghiễn cứu nảy có “trọng lượng” hơn các nghiên cứu khác 
trong nhỏm. 

Do đó, để tính trung bình rỉ cho tổng số nghiên cứu, chúng ta phải xem xét 
đến trọng số W. Với mỗi và W chúng ta có thể tính trị số trung bình trọng số 
(weighted mean) theo phương pháp chuẩn như sau: 


k¿ 
2.4, 
= jä——— 
Š, 
„1 
Bất cử một ước tỉnh thống kê (estimate} nào cũng phải có một nhương sai. 
Và trong trường hợp di, phương sai (tôi sẽ kí hiệu là s;} chỉ đơn giản là số đảo 


của tổng trọng số W; 
Ũ 
3 


sa = m 
Xw 
l 


Sai số chuẩn (standard error, SE) của d, do đỏ là: SE(d) = z„. Theo lí thuyết 
phân phối chuẩn (normal distrihutian), khoảng tin cậy 959ñ (95% conltidence 
interval, 85%CT) có thể được ước tỉnh như sau: 


95%CI của d= đ+1.96(s„) 
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Để tính d chúng ta cẩn thêm một cột nữa: đó là cột Hd,. Chẳng hạn như với 
nghiên cứu 1, chúng ta có W?d, = 0.0246 x 20 —0.4828. Tiếp tục như thể, chúng 
ta có thêm một cột. 


Tỉnh toán trị số trung bình 


——- 
T 
sm 
TC 


TP 


—— Tem |snm. 


Sau đó, cộng tất cả W, và R.d, (trong hàng "Tổng số” của bảng trên). Như vậy, 
trị số trung hình trọng số của ¿ỉ là: 
+ 


_€ '' (4928+09771+..—043383 57140 _ 
3 g - Ú0246+04886+..+00483 1/6354 


L_ _nói 
345 


Và phương sai của d là: g) = r 

Ni cách khác, sai số chuẩn (standard error} của d là: s, =+/Ú.61 =0.782 

Khoảng tin cậy 9594 (95% conlidence interval hay 95%CI}] có thể được ước 
tỉnh như sau: 


3.49 + 1.86 x 0.782 = 1.96 đến 5.02 


Đến đây, chúng ta có thể nói rằng, tỉnh trung hình, thời gian nằm viện tại các 
hệnh viện đa khoa dải hơn các bệnh viện chuyên khoa 3.49 ngày và 959 khoảng 
tin cậy là từ 1.36 ngày đến 5.02 ngày. 
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Bước 4: Ước tính chỉ số đồng nhất (bomogeneity) và bất đồng nhất (hetera- 
geneity) giữa các nghiễn cứu. Trong thực tế, đây là chỉ số đo lưởỡng độ khác hiệt 
giữa mỗi nghiên cửu và trị số trung binh trọng số. Chỉ số đồng nhất (index of 
hoamangeneity) được tính theu công thức sau đây: 


0= S4 ~d) 


Ở đây, k là số nghiên cứu (trong ví dụ trên k = 9}. Theo lí thuyết xác suất, Q 
có độ phân phối theo luật Chi-square với bậc tự do (degrees of [reedom - dÍ) là 
k-1 (tức là y¿,}. Nói cách khác, nếu Q lớn hơn y¿¿ thì đỏ là tín hiệu cho thấy 
sự bất đẳng nhất giữa các nghiên cứu “có ý nghĩa thống kể” (signiicant). 

Nhiều nghiên cứu trong thời gian qua chỉ ra rằng Q thường không phát hiện 
được sự bất đồng nhất một cách nhất quản, cho nễn ngày nay ít ai dùng chỉ số 
này trong phân tích tổng hợp. Một chỉ số khác thay thế Q có tên là index of 
heterogeneity (Ï)mà tôi tạm dịch là chỉ số bất đồng nhất, nhưng sẽ giữ cách 
viết Ï. Chỉ số này được định nghĩa như sau: 

ïˆ< Ø@-(#—Ù 
Q 

PF có giá trị tử ãm đến 1. Nếu ï < Ú, thi chúng ta sẽ cho nó là ñ; nếu F mẩn 
hãng 1 thi đỏ là dấu hiệu cho thấy có sự bất đồng nhất giữa các nghiên cửu. 

Trong ví dụ trên, để tiớc tính Q và ƒ, chúng ta cẩn tính W;(d, — đ}” cho từng 
nghiên cứu. Chẳng hạn như, với nghiên cứu l: 


HW'(d, - dƒƑ = 0.0246 x (20 — 3.49} = 6.7129 
Tỉnh toán các chỉ số đồng nhất và bất đồng nhất 


De | s | 2 | vì | mg [mg gi 


00246 24o | 04928 - J9 8 | 67128 - ./l29 


—_——+—: 1= 


¡| ñ | mm 2 | o0ớ | 005 | xE- 
7 | 1 | mr | sa [0mm | 0mợ—, 
¿| 1 [} H: [am | 3| lemm- 


- "RỖ - 


https://tieulun.hopfo.org 


em | 52M0 | 2H - 


Sau khi đã ước tính H/(d, — đ} cho từng nghiên cửu, chúng ta cộng lại số này 

(xem cột sau cùng) và đó chính là 
ˆ 
0= `W;(d—d} =241.05 
Từ đó, Ƒ có thể ức tỉnh như SaU: 
„_241/05—8 
241.05 

Chỉ số bất đồng nhất P rất cao, cho thấy độ dao động về d giữa các nghiên 
cứu rất cao. Điểu này chúng ta có thể thấy được khi nhìn vào cột số 2 trung bảng 
thống kê trên. 


=(I.Đñ6 


Bước 5: Đánh giả khả năng nuhÏication bias. Puhlication bías là một khải 
niệm tương đổi mới có thể giải thích bằng tình huổng thực tế sau đảy. Chúng ta 
hiết rằng khi một nghiên cứu cho ra kết quả “negative” (kết quả tiêu cực, tức là 
không phát hiện một ảnh hưởng hay một mỗi liên hệ có ý nghĩa thống kẻ) cũng 
trinh nghiên cứu đỏ rất khỏ có cơ hội được công hỗ trên các tập san, bởi vì giới 
chủ hút tập san nói chung không thích in những hải như thể. Ngược lại, một 
nghiền cửu với một kết quả "tích cực” (tức có ý nghĩa thống kẻ) thi nghiên cứu 
củ khả năng xuất hiện trên các tập san khoa học cao hơn là các nghiên cứu với 
kết quả “tiêu cực” Thể nhưng phần lớn những phân tích tổng hợp lại dựa vào các 
kết quả đã công bổ trên các tận san khoa học. Do đó, ưức tỉnh của một phần tích 
tổng hợp cỏ khả năng thiếu khách quan, vì chưa xem xét đấy đủ đến các nghiên 
cứu tiêu cực chưa bao mử công hỗ. 

Một số nhà nghiên cứu để nghị dùng biểu đỗ funnel (còn gọi là Eunnel nÏot} 
để kiểm tra khả năng nuhÌicaHon bias. Biểu đỗ flunnel được thể hiện bằng cách 
vẽ độ chỉnh xác - precision (trục tung, y-axis) với ước tỉnh mức độ ảnh hưởng 
cho từng nghiên cứu. Ởi đây precisian được định nghĩa là số đảo của sai số chuẩn 
(standard error]: 

l 


Precisinn = — 


s.- 
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Nói cách khác, biểu đỗ funnel biểu diễn precisian với d. Chẳng hạn như với 
nghiên cửu 1, chúng ta có: nrecision = |7 x 40,6 = ñ.] 57. Tính cho từng nghiên 
cứu, chủng ta cỏ thể dùng hảng thống kẻ sau để vẽ biểu đổ funnel. 


Ước tính nuhlication hias 


1 


Precisian 
:, NRNHh 


lũữ .#Ũ sũ :q0 -;Ù ũ zũ 4ũ CỦ ĐẦU 


Biểu đã funnel (biểu đề phẫu): trục tung là prerisinn và trục hoành là d. 
Biểu đổ này cho thấy phần lớn các nghiên cứu có kết quả thời gian nằm viện 
trang các bệnh viện da khoa thường lầu hơn các bệnh viện chuyên khoa. 
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Cái logic đăng sau biểu để funnel là nếu các công trình nghiên cứu lửn (tức 
có độ precision cao) có khả năng được công bố cao, thì số lượng nghiên cứu với 
kết quả tích cực sẽ nhiều hưn số lượng nghiên cứu nhỏ hay với kết quả tiều cực 
trong các tập san. Và nếu điểu này xảy ra, thì biểu để funnel sẽ thể hiện một sự bất 
xứng (asvmmmetry). Nói cách khác, sự thiểu cân đối của một hiểu để funnel là dấu 
hiệu cho thấy có vấn để về puhlicatian hbias. Nhưng vấn để đặt ra là nublicatian 
hias đó có ý nghĩa thống kê hay không? Biểu đổ funnel không thể trả lời câu hỏi 
này, chúng ta cần đến các phương pháp phân tích định lượng nghiêm chỉnh hơn. 


Kiếm định Egger 

Vải năm gắn đảy cỏ ý kiến cho răng biểu đỗ funnel rất khó diễn dịch, và có 
thể gây nên ngộ nhặn về puhlication bias [5-6]. Thật vậy, một số tận san y học 
có chỉnh sách khuyến khích các nhà nghiên cửu tìm một phương pháp khác để 
đánh giá publicaHon bias thay vì dùng biểu đổ funnelL. 

Một trong những phương pháp đó là kiểm định Egger (còn gọi là Egger5 
test). Với phương pháp này, chúng ta đưa ra mô hình rằng $SND = ñ + b x 


precisian, trang đó SND được ước tính bằng cách lấy dỈ chia cho sai số chuẩn của 
d, tức là: ND, cất, ñ và b là hai thông số phải ước tính tử mô hình hỗi qui 
4 


di 
đưởng thẳng đó. Ở đây, acung cấp cho chúng ta một tiớc số về tình trạng thiểu 
cần đối của hiểu đỗ funnel: a > ñ có nghĩa là xu hướng nghiên cứu cảng có qui 
mỗ lớn cảng có ước số về độ ảnh hưởng với sự chỉnh xác cao. 


Trong vỉ dụ trên, chúng ta có thể dùng một phần mềm phản tích thống kê để 
ước tính a và b như sau: 
SNH = 4.20 + (_4.17084) x precision, 


Kết quả ước số ä = 4.20 tuy là > ũ nhưng không cỏ ý nghĩa thống kẻ, chủ nên 
ở đây băng chứng cho thấy không có sự puhlicatian hias. 

Tuy nhiên, như đã thấy trang thực tế, nghiệm toán Egger này cũng chỉ là một 
cách thể hiện biểu đỗ Ífunnel mà thôi, chứ cũng không có thay đổi mì lớn. Có một 
cách đánh giá puhlication bias, cho đến nay, được xem là đáng tin cậy nhất: đó là 
phương pháp phần tích hồi qui đường thẳng (linear regression) giữa dÍ và tổng 
số mẫu (N). Nói cách khác, chúng ta tìm a và b trong mô hình [?]}: 


d=a+bxN, 


- =äq - 


Mếu không có puhlicatian bias thì giả trị của b sẽ rất ẩn với 0ñ hay không cỏ 
ý nghĩa thống kẻ. Nếu trị số b khác với Ù thi đỏ là một tín hiệu của puhlication 
hbias. Trong vỉ dụ vừa nêu với dữ liệu sau đây, 


[Na | 4 [ N | 


chúng ta có phương trình: 
d.= 16.0 - 0.0009 x N, 


và quả thật giả trị của b quá thấn (cũng như không có ý nghĩa thống kế), cho nên 
đến đảy chúng ta cỏ thể kết luận răng không có vẫn để nuhÌicaHon hias trong 
nghiên cửu vừa để cập đến. 


Mi tóm lại, qua phản tích tổng hợp này, chúng ta có bằng chứng đáng tín cậy 
để kết luận rằng thời gian năm viện của bệnh nhãn trong các bệnh viện đa khoa 
dài hơn các bệnh viện chuyên khoa khoảng 3 ngày rưỡi, hoặc trong 95% trường 
hợp thời gian khác biệt khoảng từ 2 ngày đến 5 ngày. Tuy nhiên, kết quả phản 
tích randam-effects (xem mã R} cho thấy kết quả không có ý nghĩa thống kê. Da 
đó, có sự khác biệt đáng kể giữa hai phương pháp phân tích. 


Trên đảy là một số phương pháp vá chỉ tiết kỉ thuật trong nhắn tích thống 
kê thường hay thấy trong y học thực chứng. Miột số phương pháp phản tích rất 
đơn giản mà bạn đọc có thể làm một cách thủ cũng, nhưng một số phương pháp 
cần đến nhắn mềm phản tích thống kẻ như R mả tôi đã giới thiệu. Tuy nhiên, 
người thấy thuốc không nhất thiết phải làm chủ các phương pháp nảy, không 
cần phải thuộc lòng công thức tỉnh toắn cũ mẫu hay củng thức phần tích; người 
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thầy thuốc cần phải hiểu ý nghĩa của kết quả phân tích. [3a đó, tôi muốn nhấn 
mạnh đến ÿ nghĩa và cách diễn giải hơn là chỉ tiết kĩ thuật. Tôi hí vụng rằng qua 
những mỗ tả trong chương nảy đã giúp cho các hiểu sâu hưn vả tốt hơn về 
triết lí cũng như "đâu ra” của phản tích thống kẽ. 

Thống kê tự nó là một bộ mỗn khoa học, má cũng là một công cụ quan trạng 
cho nghiên cửu khoa học. Là khoa học, các phương phán thống kẻ phải cỏ giả 
định đăng sau. Giả định có thể đúng, nhưng cũng có khi sai, và khi sai thì kết quả 
phân tích cũng khó tin cậy. Người thấy thuốc quan tâm đến bệnh nhản, và do đả 
cần phải đặt ý nghĩa của kết quả phân tích thống kẻ trang hối cảnh thực tế lắm 
sàng, chứ không nên trở thành nỗ lệ của những mỏ hình thống kẽ. 


18. Ghi chú kĩ thuật 
Mô hình hổi qui tuyển tính đa biến (ví dụ 12) 


id = 1:12 
sex = C{Ũ, Ú, 1, 1, 1, 0Ú, 1, 0, 1, 0, 1, 0} 
aqe = cCÍ52, 58, 67, T3, 64, 74, 51, 61L, 65, 4ö, T2, 65} 


weight = c([7H.5, H3.5, BHB, 95.7, 88.9, 38.8, H5.3, 85.3, 
33.3, T5.H, 8H.4, BỤ,B} 


BP = c[132, 143, 153, 162, 154, 168, 137, 148, 158, 12B, 
166, 140] 


dat = data.frame (BE, 1d, äqe, sExX, wEGIqht] 

maiiecll = lIm[ịBE - aqe + welnht + as.fartor (aex], data=dat] 
moidieEl2 = Im[(BHE - aqe= + welqnht + data=dat]} 

aummary (model; suimmmar (model 2} 

Mô hình hổi qui logistic (ví dụ 13) 

1q = 1:zZñ 

atroke = cÍrep(1l, 10], rep(0,10}) 

angqer = CÍ(Ú,Ũ,gÚ,1,1,1,1,1,1,1, ,Ủ,D,D,DÙ,D, 1,1,1,1J) 


anxiety = c(71, BÚ, 50, 60, 40, 65, 75, BÚ, TÚ, 6Ú, 65, 50, 
45, 35, 40, 5Ú, 55, 45, 50, 6D] 


dat = data.frame (1d, stroke, anqer, äanxIety} 
mmœieễll = qlm{stroke ¬~- anqer, data=dat, famlly=hlnomlal] 


aummar+y (mode ] 1 ] 
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Phương pháp Kaplan-Meier (vỉ dụ 14) 


1d = 1:23 


time = c{6, 12, 21, 27, 32, 39, 43, 43, 46, B9, 115, 139, 
181, 211, 217, Z61, Z61, 270, 295, 111, 335, 346, 35] 


status = c(1, 1, 1, 1, 1, 1, 1, 1, Ú, 1, Ö, 0Ô, Ú, Ú, 0Ú, 1, 
1, 1, Ú, 1, 0Ú, Ú, DỊ 


#Ÿ status được mã hỏa lả =censored 1=dear 

dat = data.frame (1d, time, äatatun) 

11hrary (survlval] 

aqurvtime = Surv{time, status==l} 

kb = qurvit (Surv (time, atatus==l) = 1) 
=äummar + ( kP] 

pliat (kpì 

Phương phản Kaplan-Meier: so sánh 2 nhóm (vỉ dụ 15) 
timel = c(17.3, 5.4 


11.0, 9.2, 12.1, 
9,2, 2,5, B.T7y 


B.2, 12.2, 11.7, 10.0, 5.7, 9.8, 2.6, 


3 
atatual = cœ[{Ủ, 1 
1, 1, 1, 1, 1, 1, 
time2 = c(5.8y, 2 
2,1, 1,3, 5,5, 1 
7.8, 4.7, 3.5} 


# 
2.2, 1.8, 10.2, 10.17, 11.1, 5.3, 3.5, 


gLatus2 = c[1, 1, 1, 1, 1, 1g 1, 1, 1, 1, 1, 1g 1, 1, 1, 1, 


Ty lý lạ (l1; :la ly 5; ly đJ] 
timg = CÍ[t1imel, tC1meZ2]} 
aqtatua = cÍ{statusl, statusz]) 
qroup = cCÍrep|ll,25], rep(2z2,z25]] 
dat = data.frame (time, atatus, QqTrOUIP) 
11hrary (survlival] 
kp.hy.qroup *#= qurvfiit (Surv (time, atatua==l] ~ qroup] 
aummairv | kp. hy .qrnup] 
lat (kp.bhy.qroup; 

xilah=”T1ime”, 

ylahb=”Cum., survival prohablllty”, 
1wd=2, 
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Cil=c [”"black”, ”“red”]] 
aurvd1ff (Survw (time, status==l] ~ qroup] 


Ví dụ 16: Mô hình Cox - Thời gian sống ở bệnh nhân ung thư bạch cẩu 


qroug = c{ren(l,21), rep{l, 21]) 
time = c(6,6,6,7,10,13,16,22,23,6,5,10,11,17,18,20,25,32,32, 
34,35,1,1,2,2,3,42,4,5,5,8,B,8,8,11,11,12,12,15,17,22,23] 


atatusa = c(1, 1, 1, 1, 1, 1, 1, 1, 
1,0,0,0,0,0,0,0,0,0,0,0,0, 1,1,1/0,1,0,0,1,1,1,1, 0,1,1,0, 
1r1,g1g0,1,1] 


mhớ = c(2.31,4.06,3.28,4.43,2.36,2.HH,3.60,2.32,2.57,3.20,2, 
B0, 2.70,2.60,2.1E6,2.05,2.01,1.7B,2.20,2.53,1.47,1.45, 2.80,5 
.0,4.91,4.48,4.01,43.36,2.42,3.49,3.37,3.52,3.05,2.32,3.26,3 
.48,2.12,1.50,3.06,2.30,2.95,2.73,1.87] 


đát = dataä. Ýrame [qroup, tL1me„ sELatuäs, whc } 

#Ÿ analysin bự EP and Cox model 

11hrary [surv1val } 

#Ÿ status = Ú lả tử vong 

baseline = 5Surv[time, statuis==l} 

km = säurviit (haselline ~ l1] 

#Ÿ Cox model 

CAX “ COXPH [Surv [time, satatus==l) ¬ qroup + wBbc} 


=ummar+ [Cox] 


Ví dụ 17: Phân tích tổng hợp biến nhị nhân 


fŸ SỐ liệu qỗc 


EBR - cdoeath ContLrnl Cantrnl — 
—MN deaLh 


# Triển khai với R 


#Ÿ Nhập dũ liệu 
=tudy = 1:13 


H1 = c(25, 8, 134, 25, 105, 320, 33, 261, 133, 232, 1327, 
1380, Z14) 


DL = c{5, 1l, 23, 1, 4, 53, 3, 12, 6, 2, 156, 145, BỊ 
HŨ = c({25, l6, 188, 25, 34, 321, 16, B4, 145, 134, 1320, 


2001, 212) 

DŨ = c{(6, 2, 21, Z, 2, 67, 2, 13, 11, 5, 22B, Z17, 1T} 
81 = H1-DI 

Sũ = Hũ-Dũ 


bhh = data.frame(Study, H1, D1, 51, HŨ, Dũ, 5Ú) 

f tính effect size 

11hrary [metafor] 

=q3 “= fqCaLC [meaqnure = “RE”, a1=DI, bi=5l, c1=DD, d1=Š5D, 
data=kh, appendi=T} 

#Ñ Random effecEsa model 

r8 = rma (y1, vi, data = esg} 

=äummar + r#} 

Plot [re] 


†nrest [re, atransF=expP} 


Ví dụ 18: Phân tích tổng hợp biến liên tục 


Dữ liệu qỗc: 
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#Ÿ Nhập dũ liệu vào RE 

nÌ = œ{155,31,75,18,8,57,34,110, 60} 

laal = c(|55,27,04,66,14,15,52,21,30} 

adl = cœ{47,71,17,2n,8,7,45,165,27) 

n2 = CÍ156,32, 71,1BH,13,52,311,183,52}) 

lns2 = C(75,28,118,137,18,1H, 41, 31, 23] 
=d2 = c(b64,4,29,4H,11,3,34,27,20] 

lnz = daạata.frame [nÌl, Lasl, sdl,nz2„, las2,sd2}) 
#Ÿ Dùng metafor cho phãn tích tông hợp 
11hrary (metafor] 


Ÿ tỉnh effect s1ze 


=a = EBEaCalC [measure=”MD”, nlI1=nl, mlili=losgl, sdl1=sdl, 


n21=n2, m21=lon2, äad21=sd2, data=los, äappend=T) 
Ÿ tiên hành random-effects meta-analysis tren eœs 
res = rma(yl, vi, tdata=es} 

blot [res} 

T†orest [rea] 

fÊ tiền hành fixed-effectsa meta-analysia tren ea 
reas = rma(y1, vi, cđat†ta=es, method=”EE”)] 

blnt [res] 


t†orest [reas] 
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18 
UÚC TÍNH CŨ MẪU 
VÚI PHÂN MÊM R 


tỉnh rất cả ích cha các nhân tích thấng kẽ. Trang khaảng hai năm qua, R 

đẳñ trả thành cực kì nhổ hiến trang các viện nghiên cửu và đại học trên thể 
giới, và dược dùng như là một nhưng tiện chủ giảng dụy và nghiền cửu về thống 
kê học {*). Vì R hoàn toàn miễn phí nhưng củ năng lực phân tích dữ liệu caa hơn 
các nhụ liệu thưởng mại (như SPSS, SAS, Stadta, v.v...) nên các chuyên gia dự đuẳn 
rằng R sẽ trữ thành một nhu liệu thống kế học phổ hiển nhất trung tưng lai mẫn. 
Da đả, chúng ta cần phải hục và “làm quen” tới R qua sử dụng nhà liệu nảy trang 
các phân tích chữ liệu. Trang bài này, tôi sẽ giởi thiệu một số nhưng pháp tắc tính 
cũ mẫu cha một nghiên cửu bằng cách dùng R. 

Mỗi nghiên cứu khoa học có liên quan đến quần thể và cũ mẫu đều cẩn phải 
cỏ tiức tỉnh số đối tượng cần thiết. Hai chữ “đối tượng” ở đây cẩn phải hiểu theo 
nghĩa rộng: với nghiên cứu lắm sảng, đổi tượng cỏ thể là bệnh nhắn; với nghiên 
cứu mang tỉnh điểu tra xã hội, đổi tượng cỏ thể là cá nhãn trong cộng đẳng; với 
nghiên cửu trên động vặt, đối tượng có thể là chuột. Mục tiêu của việc tức tính 
cử mẫu là ước tính số lượng đãi tượng cẩn thiết (không quá thấn và cũng không 
quả cao) để kiểm định một hay nhiều giả thuyết khoa học. Số lượng đổi tượng 
cỏ liên quan đến đạo đức khoa học, qui mỗ nghiên cứu và chỉ phí, nên việc tiớc 
tính cỡ mẫu cần phải được xem xét và cẵn nhắc rất cẩn thận. 


R-: một ngân ngữ thống kê học, nhưng cũng củ thể xem là một nhu liệu rảy 
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1. Thông tin cẩn thiết cho ước tính cử mẫu 


Những yếu tổ cẩn phải xem xét và cần nhắc trong tiớc tính cũ mẫu là mỗ 
hình nghiên cứu, biến số phản tích, mức độ ảnh hưởng, và mức độ sai sót trong 
kiểm định giả thuyết. Nhà nghiên cứu cần phải có những thông tín này trước khi 
ước tính cũ mẫu. Không có những thông tin trên thi không thể ước tỉnh cũ mẫu. 
Dưới đây là vải giải thích ngắn về 4 thông tin trên. 


1.1. Mã hình nghiên cứu 


Trong nghiên cứu y khoa, người ta nhân biệt các mỗ hình nghiên cứu theo 
thời gian như sau: 


Nghiên cửu cất ngang (cross-sectianal study} là mô hình nghiên cứu thường 
có mục tiêu ước tính một tỉ lệ hiện hành (prevalence} của bệnh ngay tại thời 
điểm thực hiện nghiên cứu. Vĩ dụ như nhà nghiên cứu muốn tiớc tỉnh số người 
mắc hệnh xương khớp trung quần thể, nhà nghiên cứu có thể lấy mẫu gỗm nm cá 
nhân, và làm xét nghiệm để xác định có mắc bệnh hay không. Tï lệ mắc bệnh có 
thể tước tính từ xét nghiệm ngay tại thời điểm đỏ. 

Nghiên cửu bệnh chứng (case-control study) là nghiên cứu ngược thởi gian 
để đánh giá mỗi liên quan giữa một yếu tổ nguy cơ và bệnh. Thông thường, nhà 
nghiên cửu chọn một nhóm bệnh nhân và một nhóm chứng, và thu thập thông 
tin về yếu tổ nguy cơ trang quả khử của mỗi cá nhân. 

Nghiễn cầu đuàn hệ (hraspeciive siuddy, có khi còn gọi là langrturdinal siuddy] là 
nghiên cứu thưởng củ mục tiêu tìm hiểu yếu tổ nguy cơ ảnh hưởng đến nguy cơ 
mắc hệnh. Chẳng hạn như để đánh giá mỗi liên quan giữa tỉ trọng cơ thể (body 
mass index - BMI]) và tử vong, nhà nghiên cứu có thể lấy mẫu n cá nhẫn, đa BMI 
lúc ban đầu, và sau đỏ theo đi trang vòng [ví dụ như] 5 năm để biết bao nhiễu 
người sống và tử vang. Mỗi liên quan giữa BMI lúc ban đầu và nguy cơ tử vong 
có thể phản tích tử dữ liệu theo thời gian như thể. Nghiên cứu lâm sảng RCT 
(randomized controlled trials) có thể xem là một mỗ hình nghiên cứu đoàn hệ. 

1.2. Biến sẽ kết quả 


Một nghiên cứu định lượng thường có một hiến số chính, hay gọi là nufcome 
hay biển kết quả. Biển kết quả có thể là biến liên tục (như huyết áp, nỗng độ 
glucose, mặt độ xương, v.v...) hoặc biến nhị phân (như sống/chết, bệnh/khăng 
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bệnh). Phần biệt biến kết quả rất quan trọng vì sự phân biệt này xác định phương 
pháp ước tính cũ mẫu. 


1.3. Mức độ ảnh hưởng 


Bảy là một thông tin rất quan trọng cho tiớc tỉnh cỡ mẫu. Không cỏ thông tin 
này thì không thể nàn ước tỉnh cũ mẫu. Trong thực tế, mức độ ảnh hưởng (còn 
gọi là effect size - SE) tùy thuộc vào mô hình nghiên cứu. Dưới đây là vài mỗ tả 
về cách xác định thông tin về mức độ ảnh hưởng đơn giản: 


s« Nếu là nghiên cửu cắt ngang, và mục tiêu là ức tính một tỉ lệ hiện hành 
(prevalence rate). Nhưng vì tỉ lệ có thể đao động giữa các mẫu nghiên cứu, 
nên một tham số khác cẩn phải xem xét đến: đó là sai số (gọi là margin dƒ 
errur}. Giả dụ răng chúng ta biết răng tỉ lệ là p và sai số là e, thi E5 = píe. 


œ«_ Nếu là nghiên cửu cắt ngang, và mục tiêu là ước tỉnh một tham số liễn tục. 
Chẳng hạn như để ước tính mật độ xương trong quần thể, nhà nghiên cứu 
có thể lấy mẫu m cả nhẫn, và đo mật độ xương. Trị số trung bình của mẫu 
là một ưức số cha giá trị trung bình của quản thể. Do đó, trị số trung bình 
mẫu m văn chịu sự dao động ngắu nhiễn giữa các mẫu, và sai số để mỗ tả 
là sai sổ e. Trang trưởng hợp nảy, ES = mực. 

se hiếu là nghiên cứu có mục tiêu so sánh giữa hai nhóm, và trong trưởng 
hợp này nghiên cứu phải có hai tham số về trung bình (T, và T,}) và tham 
số về độ lệch chuẩn (S, vả 5.1, E5 được định nghĩa là hiệu số giữa T, và T, 
chia cho ä: T—T: 

^| đc tấ 

Nếu biến kết quả là biến liên tục, nghiên cứu sẽ có hai số trung bình m, và m., 
và trong trưởng hợp này, E# = (m, —m,)!-lã +Ắ. 

Nếu biển kết quả là biến nhị phản, nghiên cửu sẽ có hai tỉ lệ p, và p., và trong 
trường hợp này, E5 có thể ước tính băng hiệu số E5 = arcsin(p,) — arcsin(p. ). 

1.4, Mức độ sai sốt trang kiểm định giả thuyết 


kŠ = 


Đứng trên quan điểm phương pháp luận, mỗi nghiễn cửu thưởng cỏ mục 
đích kiểm định một giả thuyết khoa học chỉnh. Trong thống kẽ, người ta nhân 
biệt 2 loại miả thuyết: giả thuyết vỏ hiệu (nuÌÏ hypothesis, thường kí hiệu là Hũ} và 
giả thuyết đảo (alternative hypaihesis, kí hiệu HA). Giả thuyết vỏ hiệu, như tên 
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gọi. phát biểu ngược lại với những gì nhà nghiên cứu muốn biết. Nếu giả thuyết 
đảo (hay giả thuyết chính) là bệnh nhãn nhỏm À có nguy cơ hiến chứng cao hưữn 
hệnh nhãn nhóm B, thì giả thuyết vô hiệu sẽ phát biểu là “bệnh nhãn nhỏm B có 
nguy cơ biển chứng cao hơn bệnh nhân nhóm Äˆ Tương tự, nếu giả thuyết chỉnh 
phát biểu răng cỏ mỗi tương quan giữa X và Y, thì giả thuyết vô hiệu phát biểu 
răng không có mỗi tương quan giữa X và Y. 

Vĩ dụ như nếu nhà nghiên cửu muốn xác định hiệu quả của thuốc chống lãng 
xương, vả quyết định tiến hành một nghiên cửu theo mỗ hình RCT; với hai nhỏm 
hệnh nhân: Một nhóm được điểu trị bằng thuốc và một nhóm chứng, cả hai nhằm 
được theo dõi 3 năm. Biến kết quả là tỉ lệ mấy xương trong thời mian theo dõi. Gọi 
tỉ lệ gãy xương của hai nhóm là p, và p., giả thuyết võ hiệu (kí hiệu HH) là: 

HÙ: p, =P, 
Và giả thuyết chính có thể là: 
HÀ:pP,#P. 

Nên nhở rằng nhà nghiên cứu không thể chứng mình Hũ; nhà nghiên cứu 
chỉ cá thể bác bà Hũ và do đó gián tiếp chấp nhận HA. Cơ sở để bác bỏ hay chấp 
nhận một giả thuyết là chỉ số thống kẻ (như t test, Ki bình phương, hồi qui tuyến 
tính, v.v...). Kết quả kiểm định thống kẻ có thể “có ý nghĩa thống kế” (skaiisiical 
sipmiltcance} hay không có ý nghĩa thống kẻ (statistical insipnihcance). Da đó, mỗi 
kiểm định giả thuyết, nhà nghiên cứu phải đối phó với 4 tình huỗng (xem bảng). 


Bảng 1. Kết quả kiểm định thống kẽ và giả thuyết vô hiệu 


Kết quả kiểm định thống kê | Giả thuyết Hũ đúng Giả thuyết Hũ sai 


Có ý nghĩa Sai sút loại Ï 
(tức bác bỏ Hũ} (trpe Ï error, a} 
Không có ý nghĩa ai sót loại lÏ 
(chấp nhận Hñ]) (trpe lÏ error, Ê) 


«@ Kết quả kiểm định “có ý nghĩa thống kế, và giả thuyết Hũ là đúng, nhà 
nghiên cửu kết luận sai, và sai sút này tạm gọi là sai sót loại Ï (fype Ï errar, 
hay aỈnha); 

s« Kết quả kiểm định "có ý nghĩa thống kế”, và giả thuyết HŨ là sai, nhà nghiên 
cứu kết luận đúng; 
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s Kết quả kiểm định “không có ý nghĩa thống kể, và giả thuyết Hũ là đúng, 

nhả nghiên cửu kết luận đúng; 

se Kết quả kiểm định “không có ý nghĩa thống kể, và giả thuyết HŨ là sai, 

nhà nghiên cửu kết luận sai, và sai sốt này tạm gọi là sai sót loại II (Fype TT 
errur, hay beta)}. 

Nhả nghiên cứu phải xác định mức độ sai sót loại I và loại II trước khi tiớc 
tính cữ mẫu. Thông thưởng, alnha được xác định ở mức 0.05 hay 0.01, còn đổi 
với beta, các nhà nghiên cứu thường chấp nhận sai sót 0.20 hay 0.10. Cẩn nói 
thêm rằng, Ì — beta củn được để cận đến là nawer. Power của một nghiên cứu là 
độ nhạy của nghiễn cứu đỏ (cũng tương tự như độ nhạy hay sensifivify của một 
xét nghiệm chẩn đoán). Cần nhắc lại rằng, độ nhạy của một xét nghiệm có nghĩa 
là xác suất mả một cá nhãn mắc bệnh cỏ kết quả dương tính. Do đó, pawer của 
nghiên cửu là xác suất mà nghiên cứu cho ra kết quả có ý nghĩa thống kê nếu giả 
thuyết HA đúng (Hũ sai). 

Mỗi sai sót aä và B đi kẽm theo một hãng số của phần hỗ chuẩn (z}, và hãng 
số này được sử dụng trong tính toán cữ mẫu. Chẳng hạn như (trang trường hợp 
kiểm định 2 chiểu) nếu a = Ù.ũ5 thi z = 1.96, nếu a = ũ.Ú1 thì z = 2.56. Sau đây là 
vài hãng số phổ biến. 


Bảng 2. Hằng số z liên quan đến sai sót loại I và loại II 


Hãng số z liên quan đến a | Hằng số z liên quan đến 
(kiểm định 2 chiếu) 


=a =01,z= 2.576 Ê= 0.01, z = 2.326 


a =Ú.Ũ5, z = l.860 Ê= 0.05, z = 1.645 
a =Ũ.1Ú, z = Ll.ê45 Ê = 0.10, z = 1.382 
_ a=.2l,z= 1.282 Ê = 0.20, z = 0.842 


Chủ thích: cỏ thể tỉnh bằng hàm qnormÍ+x/2), trong đó x = 0.01, 0.05, 0.10, 
W.V... 
1. Ước tính cử mẫu bằng R 
Phần lửn các phương pháp ước tỉnh cũ mẫu có thể tôm gọn trong công thức 
(ESỶ 
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Trong đỏ, k là hằng số cổ định, Ca, B} là hãng số z liên quan đến sai sót loại 
I và sai sốt loại II như sau: 


Trong công thức trên, vì E5 là mẫu số, nên nếu EŠS thấn thì m sẽ tăng, và nếu 
E5 cao thi n sẽ giảm. Tất cả các phương pháp tiớc tỉnh cỡ mẫu qua cũng thức 
trên có thể triển khai trong R một cách dễ dàng. Tuy nhiên, trong có một số 
package (như sample size, pwr, epicalc} có thể sử dụng cho ước tính cỡ mẫu, 
người sử dụng chỉ cẩn gö lệnh và cung cấp những thông tin vừa mỏ tả. Phần 
dưới đầy, tỗi sẽ minh họa một số trường hợp ước tính cỡ mẫu cho từng mỗ hình 
nghiền cứu vả biến kết quả. Mỗi trưởng hợp sẽ được bát đầu hãng vài điểm chỉnh 
về li thuyết và minh họa bằng một vỉ dụ cụ thể. 

2.1. Cũ mẫu để ức tính một tỉ lệ 

Lí thuyết: Nhiều nghiên cứu có mục đích đơn giản là ước tính tỉ lệ. Chẳng 
hạn như các cuộc điểu tra xã hội muốn biết bao nhiêu người thích hay không 
thích một đảng phái chính trị hay một món hàng, hoặc nghiên cứu y tế công 
cộng củ mục đích ước tỉnh tỉ lệ hiện hành (prevalence] của một hệnh. 

Gọi rr là tỉ lệ trong quần thể (population) mả chúng ta không biết, những muốn 
ước tỉnh dựa trên một mẫu nghiễn cứu (sample). Gợi p là tỉ lệ có thể tỉnh tử mẫu 
nghiên cửu nốm n đổi tượng. Với giả trị h và n, chúng ta có thể ước tỉnh khouảng 
tin cậy (1 - a}#⁄4 của mn dao động trong khoảng (P—z„„#]< z<(P+z.„e], 
trong đó #=+¬j pH — n}Ín là sai số mẫu - margin of error. Trang thực tế, e chính 


là sai số chuẩn [standard error] của p. Do đỏ, nhát biểu ngược lại, số cử mẫu n 
cần thiết cho nghiên cứu phụ thuộc vào a, e vả giả trị p như sau: 


n={ z2) pq-p) [1 
Ể 


Ví dụ 1: Nhà nghiên cứu muốn ước tính cũ mẫu chu một nghiên cửu cỏ mục 
tiêu chỉnh là xác định tỉ lệ bệnh tiểu đường. Theo y văn, tỉ lệ bệnh tiểu đường 
trong cộng đồng người trung niên là 10. Nói cách khác, n = 0.10. Nhà nghiên 
cửu muốn ưiớc tỉnh số đối tượng cẩn thiết để ước tính tỉ lệ đó, và chấp nhận 
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xác suất 95% là tỉ lệ có thể đao động trong khoảng 8% đến 12%. Nói cách khác 
e =Í.12 — ñ.08) / 4= 0.01, tức sai số là l1. 

Chúng ta có thể dùng công thức [1] để ước tính; trong đỏ, z_,„ = 1.96 (xem 
hảng 2}, p = Ũ.1Ũ, và e = 0.01. Chúng ta có thể tỉnh thủ công với R: 


alpha = Ũ.Ũ5; z = qnorm(Ũ.DŨ5/Z} 


Ð = Ũ.1Ũ; œ = .Ũ1 
n = (z/e}^2*p*(1-p} 


Hoặc dùng hàm n.Íor.survey trang epilisnlay như sau. Chủ ÿ nếu chưa cỏ 
epicalc trong R, cẩn phải cài đặt trước với lệnh install.packages(“epilispnlay ”). 
Trong epicalc, sai số e được gọi là delta. 


1ibrary (=piDisplay] 


n = n.for.survey (p=U.1Ũ, delta=ũ.Ũ1, alpha=Ũ. 05) 


Kết quả cho thấy n = 3457. Nói cách khác, nhà nghiên cứu cẩn tuyển ngẫu 
nhiên 3457 đối tượng cho công trình nghiên cửu. 

Cách tỉnh trên dành cho trưởng hợp dân số võ hạn (iniinite}. Trong trường 
hợp nhà nghiên cứu biết rằng một cộng đồng có dân số ÑN, vỉ dụ như 100000 
người, thì cách tỉnh có thay đổi: 

n = n.Ínr.survey(n=0.1U, delta=0.01, alpha=ũ.05, nopsize=100000) 

Kết quả cho thấy n = 3342. Dĩ nhiên, thay đổi delta (tức e) sẽ thay đổi số cỡ 
mẫu khá lớn. Chẳng hạn như nếu nhà nghiên cứu chấp nhận sai số 2⁄4 (delta = 
.02) thi số cữ mẫu bảy mữ là n = 857 người. 

3.2. Cử mầu để trắc tính số trung bình quấn thể 

Lỉ thuyết: Chúng ta muốn ước tính giá trị trung hình H của một hiển trong 
quẩn thể (không biết). Tuy nhiễn, chủng ta biết rằng độ lệch chuẩn của hiển là d. 
Với một mẫu gốm n đổi tượng, chúng ta có thể ước tỉnh giá trị trung bình mẫu 
m, và theo lí thuyết thẳng kẽ, giả trị trung bình quần thể sẽ năm trong khoảng m 
+ z.„(ơl^Ïn } với khoảng tin cậy (1 —- a}. Gọi z„(øi¬Ïn J là sai số e, giải phương 
trinh trên để tỉnh m, chúng ta có công thức tức tỉnh cữ mẫu đơn giản: 


~[“zZ] I2] 
Ữ 
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Ví dụ 2: Chúng ta muốn ước tỉnh tuổi bị ung thư vú, và muốn làm một 
nghiền cứu cắt ngang. Thông tin mả chúng ta có là độ lệch chuẩn của độ tuổi 
ung thư là 12 tuổi, và chúng ta muốn ước tính độ tuổi ung thư chỉnh xác trang 
khoảng + 3.5 tuổi (tức độ rộng của khoảng tin cậy 95% là 5 tuổi). Nói theo ngôn 
ngữ thống kẻ của công thức [2], chúng ta cỏ: e = 2.5 và œ = 12. 

Dùng RE: 


alpha=.Ũ5; z = qnorm(0.05/Z] 
aigqma=l2; œ = 2.5 


n = (z/e*sigma]“^Z2 ; n 


Kết quả là chúng ta cẩn n = 88 đối tượng cho công trình nghiên cứu. 
2.3. Ca mẫu để sa sảnh hai tỉ lệ 


Lí thuyết: Trong trường hợp hai tỉ lệ m, và m., tham số mà chúng ta quan tâm là 
hiệu số ỗ = m, - m,. Để kiểm định giả thuyết vô hiệu m, = m., chúng ta sẽ ước tỉnh 
hai tỉ lệ p, và p, từ mẫu nghiên cứu rm, và m. đổi tượng. Kiểm định z cho hai tỉ lệ là: 


Jh= (P, —B.) hành 
Trong đỏ, 5D là độ lệch chuẩn của hiệu số: 


và là tỉ lệ trung bình, tức  = (p, + p,M2. 


Giả định răng cỡ mẫu hai nhằm tương đương nhau và gọi chung là n, giải hai 
phương trình trên, chúng ta sẽ có công thức ước tính cũ mẫu [1]: 


2 p(l — PÌ(z„¡; + za} 
ñ=————.-_— 
(m— m) 

Vỉ dụ 3: Một nghiên cứu lẫm sàng có mục tiêu đảnh giá hiệu quả của một 
thuc điểu trị bệnh ung thư vú. Möỗ hình nghiên cứu là RCTI, nhà nghiên cứu 
chia bệnh nhãn thành hai nhóm: nhóm dùng thuốc hiện hành (nhóm 1} và 
nhóm dùng thuốc mới (nhỏm 2). Biển kết quả là tỉ lệ sống sót sau 5 năm. Sau khi 
duyệt qua y văn, nhà nghiên cứu biết rằng tỉ lệ sống sốt của nhóm Ì là p, = 75%, 
vả giả thuyết rằng thuốc mới sẽ tăng cải tiến tỉ lệ sống sót 20%, tức p, = 90% (lấy 
#5 x 1.3). Nhà nghiên cửu muốn ước tỉnh cũ mẫu sao cho nghiên cứu cỏ xác suất 
90% để “nhát hiện” mức độ ảnh hưởng đỏ với xác suất sai sót loại Ï là 5%. 


l3] 


-¬10ñ'- 


Sử dụng công thức [3] cho ví dụ trên, chúng ta cỏ p, = Ú.75; p, = Ú.9Ũ; z_„= 
1.96; z, = 1.282. Chúng ta có thể dùng hàm n.Íor.2p trong epicalc để ước tính 
cử mẫu: 


11brary (epiDisplay] 


n = n.for.Zp(PlEŨ.75, pZ=.SŨ, power=U. 9, 
alpha=I.Ũ5, ratio=l] 


Kết quả cho thấy n = 292 bệnh nhân (146 cho nhóm 1 và 146 cho nhóm 2). 
Chủ ý trong hảm trên, nower là Ï - B = 1 - ũ.10 = 0.90. Tham số ratio = Ì có 
nghĩa là số cỡ mẫu của nhóm 1 bằng số cũ mẫu của nhóm 3. Nếu chúng ta muốn 
số cử mẫu nhém 2 hơn nhỏm ] gấp 2 lần thì ratio = 3. 


1.4. Cũ mẫu để sa sảnh hai số trung bình 
Li thuyết: Đãi với nghiên cứu so sánh hai nhóm độc lập với biến kết quả là 
biến liên tục, tham số quan tâm là hiệu số của hai số trung bình quần thể m, và 
m„ tức ỗ =1w—m, Giả thuyết đặt ra là: 
Hữ: m,= m hay ỗ =0 
HA: m, # m hay ỗ # 0 
Dĩ nhiên, chúng ta không biết mị và mn, mả chỉ có thể ước tính hai số trung 
bình m, và m. qua mẫu n, và n, đổi tượng. Phương pháp căn bản để kiểm định 
giả thuyết là t-test. Gọi m, và m_ là số trung bình mẫu của hai nhóm, s, và s, là 
độ lệch chuẩn, m, và n. là số đổi tượng cho hai nhóm so sánh, kiểm định t được 
định nghĩa là hiệu số của hai số trung bình chia cho độ lệch chuẩn của hiệu số: 


¿—__ Ph —h 


Trong đỏ, 


Giả dụ rằng cũ mẫu của hai nhóm bằng nhau n = m và gọi chung là n = n, = 
n.. Vấn để là tìm n sao cho giả trị của f có nghĩa thống kê, tức sao cho trị số P của 
¡ thấp hơn a. Giải phương trình trên, chúng ta có (1): 
2y (Z +} 
" ( #3 p) [4] 
(m, — m; } 
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Nhử rằng mức độ ảnh hưởng ES là: 
ES= (mị —m; ) 


# 
Do đỏ, công thức [4] cũng có thể viết lại đơn giản hơn: 


2. +} 
`— + i3 ng) [5] 
(b3) 
Nếu a = ñ.05 và  = 0.20 (tức power bằng 0.8), thi công thức trên củn đơn 


giản hơn: l6 
,. 


> 
Œ@" 

Ví dụ 4: Để đánh giá hiệu quả của thuốc chống loäng xương. nhà nghiên cứu 
thiết kế một nghiên cứu lãm sảng gốm hai nhỏm bệnh nhân: nhóm 1 được điểu 
trị bằng thuốc mới, nhỏm 2 là nhóm chứng (placeho). Biến kết quả là mặt độ 
xương hay BMD (tính băng g/cm”). Qua nghiên cứu sơ khởi, nhá nghiên cứu 
biết răng BMD trung bình ở phụ nữ sau mãn kinh là m, = (1.80 g/cm? và độ lệch 
chuẩn là s = ũ.12 gicm. Qua y văn, nhà nghiên cứu hiết răng thuốc có thể tăng 
BMD 5% sau Ì năm điểu trị. Do đó, có thể nói mục tiêu là BMD trung bình của 
nhóm điểu trị là m. = 0.8 x 1.05 = 0.84. Giả dụ răng độ lệch chuẩn của nhóm 2 
cũng là Ũ.12 micm°. Nói cách khác, độ ảnh hưởng ESŠ là: E5 = (0.84 - 0.80)/0.12 
=Ũ.33. Nhà nghiên cửu muốn có power là B9%ö và sai sót loại T là 58. Công thức 
ước tính c mắu cho trường hợp nảy lả: 


- 28 (5 +Z„ Y 
(m, —m,} 
Chúng ta có thể dùng hàm n.far.2means trong epicalc để ước tỉnh cũ mẫu: 


1ibrary (epiDisplay} 


n = n.For.2means (mul=.BŨ, mu2=0.BH4, sd1=0.12, 
nd2=.12, power=Ũ.8, alpha=Ũ.Ũ5, ratio=l) 


Trong hàm trên mui và mu2 là chỉ số trung bình của hai nhóm, sẩ1 và sđ2 là độ 
lệch chuẩn của hai nhóm, và giả dụ rằng cỡ mẫu nhỏm | bằng nhóm 2 (ratio = 1). 


Kết quả cho thấy nhà nghiên cứu cần tuyển n = 2B4 hệnh nhắän (142 cha mỗi 
nhóm) cho công trình nghiên cứu. 
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3.5. Cử mẫu sa sảnh hai xác suất sống còn (survival curves) 


Lí thuyết: Đãi với nghiên cứu so sánh hai nhóm độc lập với biến kết quả là 
hiển thời gian sống còn (survival time), cách ước tỉnh cử mẫu còn tùy thuộc vàn 
số hiến cổ xảy ra. Dao đó, có hai ước tính: số biến cổ xảy ra cẩn quan sắt và số đối 
tượng (bệnh nhằn). Trong phản tích sống còn, chỉ số quan trọng nhất là hazard 
ratio (HR, tức tỉ số rủi ro). HR là tỉ số của hai xác suất biến cỗ xảy ra tại một thời 
điểm (kí hiệu là À, và À, cho 2 nhóm so sánh): 


H~*L 


Nếu giả định răng (vả trong thực tế cũng phù hựp cho nhiều trường hợp) 
xác suất sống còn tuẳn theo luật phản bố mũ (exponential distribution), mỗi liên 
quan giữa À và tỉ lệ sống sót m tại thời điểm T vả trung vị thời gian sống củn ÄfÍ 
có thể tóm tắt như sau: 

_—logz, —log.5 
—T  M 


Ä 


Nhưng trang thực tế, rất khỏ có được À, và À., nền HR thường được trớc tính 
dựa vào xác suất sống còn (kí hiệu mr, và mr_}: 
dị HấI: 

lop; 
Dĩ nhiên, qua công thức trên, chúng ta có thể phát biểu rằng: 
#, =exI(HÑ x lng m,} 

Trong nhiều trưởng hựp, chúng ta có thể nghĩ đến số trung vị thởi gian sống 

củn (median survival time) Mf, và M, cho hai nhóm, và HR có thể định nghĩa là: 


MỸ 
HIR—— 
M 


HR 


+ 
Với những lí giải trên, và nếu chúng ta giả định rằng số bệnh nhân nhóm ] 
và nhóm 2 theo tỉ lệ l/r, thi số biến cỗ cần quan sát cho nhóm Ì (với sai sót œ và 
B) là [2]: 


(tr (Q1—HR 


và số biến cổ cẩn quan sát cho nhóm 2: ø, = rợi. 
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Tương tự, chúng ta có thể tính số bệnh nhân cho nhóm 1 là: 


TT) Bì 


r[ú tị +r{l = z;]| 
và số hệnh nhắn cho nhỏm 3: H8 =rm. 


Bảng 3. Số biến cổ cẩn quan sắt để so sánh hai hàm số sống còn với a = fI.05 
và B = 0.20. Kết quả chỉ tính cho nhóm T (e,). Nhóm 2 là e2 = r*e, 


L" [ss[en[sz[sm[sz[ss[sz[sz Ð 
[m|m| | |— LT 


mm ..ni 
—L TL TL TT 

= mm 
“ 
mm 
— 
— 


+ + T— 
E1ammm 
[»|m[m[ | 


2l 


h8 | [mm 


a.35 
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DHWIENWI: 


nh 
SH 


—. 
` 
= 


— 


Lam 


ũ.95 


= 
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Vĩ dụ 5: Một nghiên cứu lãm sảng theo mô hình RCT nhằm mục đích đánh 
giả hiệu quả của levamisole (một loại thuốc điểu trị ung thư ruột) so với nhỏm 
chứng (placehbo). Qua y văn, biết rằng tỉ lệ sống sót trong vòng Ì năm của nhóm 
chứng là 50%, và hi vọng rằng nhóm được điểu trị là 60%. Số biến cổ cẩn quan 
sát để đạt a = [05 và B = 0.20 là 172 cho nhóm T và 172 cho nhóm 2. 

Có thể áp dụng công thức [7| để tính. Trong đó, chúng ta có m = Ú.5 và m = 
I.60, HR = log(0.6) / log(0.5) = 0.7369, và nếu r = 1 (cũ mẫu hai nhóm bằng nhan]: 
„ - (-96+0.842)Ỷ I+1x ca _ 

(I+l)x! | 1-07369 
Cũng cỏ thể tỉnh bằng hàm epi.stnysize trang nackapwe epiR như sau: 


epi .survivalsize(treat = Ũ.ÉU, control = 0.50, 


n = HÄ, power = Ũ.BŨU, r = 1, desiqgn = 1l, sided. 
test = 2, conf.level = 0.95] 


3.6. Cử mẫu cho nghiên cửu bệnh chững 

Trong nghiên cứu bệnh chứng, như để cập trong phẩn đầu, mục tiêu là so 
sảnh tỉ lệ phơi nhiễm yếu tổ nguy cơ giữa nhỏm bệnh và nhóm chứng. Gọi E là 
có yếu tổ nguy cơ, NE là không cỏ yếu tế nguy cơ, Ù? là bệnh, ND là không mắc 
bệnh (nhóm chứng). Trong nghiên cứu bệnh chứng, chúng ta có thể ước tỉnh m, 
là xác suất E trong nhóm bệnh, và mr, là xác suất E trong nhóm chứng: 
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r = P( | D} 
n, = P(E | ND) 
Giả thuyết đặt ra lả: 
HỦ: n, = n, 
HA: m,/n, = À 
Xin nhắc lại rằng chủng ta không biết m, và m, trong quấn thể. Tuy nhiên, với 
mẫu nghiên cửu, chúng ta có thể ước tỉnh hai chỉ số tương ứng là p, và p.. Gọi P 
là xác suất phơi nhiễm, yếu tổ nguy cơ là P(E), chúng ta có thể nói rằng tỉ lệ quan 
sắt p, “ P. Với giả thuyết HÀ, chúng ta có tỉ lệ phơi nhiễm yếu tổ nguy cơ trong 
nhóm chứng lả: ẠP 


Số cũ mẫu nở có thể ước tính từ các lí giải trên như sau (1): 


_Ír+D{l+(2-ÙPƑ|_ — _ | API-=P = "ƒ 
À0 | 0n T.)+zu I+a-DPƑ | [9] 


Trong đó: r là tỉ số cữ mẫu nhóm bệnh trên nhóm chứng (thường r = 1), và 


P FÄ | 
š "iaz[xd- ng 


Ví dụ 6: Một nghiên cứu bệnh chứng về mỗi liền quan giữa hút thuốc lá và 
bệnh tìm mạch được hoạch định. Theo kế hoạch, một nhóm bệnh nhắn và một 
nhóm chứng (cỡ mẫu như nhau, tức r = 1} sẻ được so sánh về tỉ lệ hút thuốc lá. 
Các nhả nghiên cứu đặt giả thuyết là tỉ số nguy cơ là 2. Khoảng 30% người trong 
cộng đồng hút thuốc lá. Câu hỏi đặt ra là cần bao nhiều người cho nghiên cứu để 
có power 90% để phát hiện tỉ số đó có ý nghĩa thống kê ở mức độ 5%. 


Trong trưởng hợp này, chúng ta có: P = 0.30, À = 2,z „ = 1.96, và z, = 1.2816. 
Thay các giả trị này vào phương trình [10]: 


P m : x+1|~0.3808 


và số cở mẫu là: 


=3ïñ 


2 


x13 ! 
"=—————- |Ì. 
03'(-0.71: 


Có thể dùng hàm epi.studysize trong epiR và có cùng kết quả: 


1ibrary (epiR) 
B=pl.Ccnlze(R = 2.Ũ, pŨ = 0.3, n = HÄ, power 


= .980, r = 1l, rho = Ũ, desiqgn = 1l, sided.teat 
= 2, conf.level = 0.95, method = "“unmatched”, 
fleiasa = ERLSE] 


Trang hảm trên, nhỏm control và treat được cho giả trị sao cho À = 2, sinma 
là tỉ lệ hút thuốc lá (tức yếu tổ phơi nhiễm trong nhóm chứng). 

3.7. Cử mẫu cha nghiên cửu đuàn hệ 

Lỉ thuyết: Nghiên cứu đoàn hệ (prospective cohort study) thưởng có mục 
tiêu tiên lượng và đánh giá yếu tế nguy cơ liên quan đến bệnh. Ngược lại với 
nghiên cứu bệnh chứng (đi ngược thời gian), nghiên cứu đoäàn hệ đi xuôi then 
thời gian. Theo đó, nhà nghiên cứu chọn một nhóm đổi tượng, đo lường các yếu 
tổ tiên lượng hay yếu tổ nguy cơ lúc đầu, và sau đó theo đối một thởi gian để thu 
thập số ca mắc bệnh. Chỉ số thống kê để đánh miá mỗi liên quan giữa một yếu tổ 
nguy cơ (như hút thuốc lá chẳng hạn) và nguy cơ mắc bệnh là tỉ số nguy cơ (còn 
gợi là risk ratian hay relative risk - RR). Gọi xác suất mắc bệnh (còn gọi là nguy 
cử - risk) trang thời gian theo đãi ở nhóm có yếu tổ nguy cơ là p.„ và nhỏm không 
có yếu tố nguy cơ là p,, KR được định nghĩa đơn giản là: 

RR =mIP, 

Vấn để thống kê là ước tính số đổi tượng và số hệnh cần thiết sao cho RR có 
ý nghĩa thống kẻ (tức P < a) với power l-B. 

Giả thuyết đặt ra lả: 

Hũ: RR = 1 (hay m, = m,) 
HA: RR z 1 (hay m, # m.} 

Trong đó, m, và m là nguy cơ mắc bệnh ở nhóm có yếu tổ nguy cơ và nhóm 
không cỏ yếu tổ nguy cơ trong quấn thể. Tuy nhiên, với mẫu nghiên cửu, chúng 
ta có thể ước tính hai chỉ số tương ứng là p, và p,. Phương pháp tiớc tỉnh cữ mẫu 
có thể dựa vàn phương pháp tiớc tính cỡ mẫu cha hai tỉ lệ theo hưởng RR. Có thể 
chứng minh qua một số thao tác toán, số cũ mắu cẩn thiết là [ I |: 


H “nen l(r+1)zú —#)+z„xRR.x,— RR.x,)+ra,(Ì— #,} Ỉ [I1| 
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Trong đỏ, m là tỉ lệ mắc bệnh trung bình của hai nhằm: 
. (r.RR +]] 
r+Ì 
Trong trưởng hợp r = Ì 
z +, 
W. = 
2 
Ví dụ 7: Nhà nghiễn cứu muốn đánh giá mỗi liên quan giữa hút thuốc lá và 


hệnh tim mạch qua một nghiên cửu đoàn hệ mả đối tượng sẽ được theo đi 5 
năm. Trước đảy, có nghiên cửu cho thấy tỉ lệ tử vong vì bệnh tim mạch mỗi năm 
ở người không hút thuốc lá là 413/100000. Nhà nghiên cứu giả định rằng hút 
thuốc lá sẽ tăng nguy cơ tử vong 40% (nói cách khác, RR = 1.4). Nhà nghiên cứu 
muốn tiớc tỉnh số cữ mẫu (số người hút thuốc lá và không hút thuốc lá) cần thiết 
với điểu kiện a = Ũ.Ũ5 (một chiểu) và power = 909% (tức heta = 0.1). 

Ở đây, chúng ta có thể ước tỉnh vải thông số cẩn thiết như sau: tỉ lệ tử vong 5 
năm nhóm không hút thuốc là m = 5 x 413/100000 = 0.02065, m = 0.02065 x 1.4 
=(.02891,z,„ = 1.6449, z,.„= 1.2816. Nếu r = 1, chúng ta có: 


= .02065x2.4 
2 


=.2478 
Vải: 


+ 
| .ñ449.l[B [n.02478 (0 7522 Ì +1.23ãñI ñ.j (0.0280 l lu.02065 (0.937915 Ï =l12I3u 


” i.4”Í0.0205] 
Nói cách khác, nhà nghiên cứu cẩn tuyển 12130 cá nhân (6065 người hút 
thuốc và 6065 người không hút thuốc) cho công trình nghiên cửu. 
Có thể dùng hảm epi.studysize trang epiR và có cùng kết quả: 
11hrary (ep1R] 


amoke = 1.4 * (5 * 413)/100000 
nonsmoke = (5 * 413]/100000 


pi .cohortsi re (exposedl = smoke, unewposed = 
nonsmoke, n “= HÃÄ, power = Ũ.9Ũ, r = 1, desiqgn = 1, 
aided. test = 1, conf level = 0.95) 


2.8. Cũ mẫu cho nghiên ciữu chẩn đán 


Lí thuyết: Trong nghiên cứu chẩn đoán, nhà nghiên cứu hay quan tâm đến 
hai chỉ số quan trọng: độ nhạy (sensitivity} và độ đặc hiệu (specihcity). Độ nhạy, 
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có khi hiểu là zldng tính thải hay true positiue, là xác suất bệnh nhãn có kết quả 
dương tỉnh (+ve). Độ đặc hiệu, cỏ khi hiểu là âm tỉnh thật hay true negniive, là xác 
suất một người không cỏ bệnh có kết quả xét nghiệm äm tỉnh (-ve). Cợi D là bệnh, 
ND là không bệnh, định nghĩa trên có thể viết theo ngôn ngữ xác suất như sau: 
Sensitivity = P(+ve | D} 
Specilicity = P(-ve | ND} 

Do đó, trong nghiên cứu chẩn đoán, chúng ta muốn biết cẩn bao nhiêu bệnh 
nhân (n } để "chứng minh” một độ nhạy khác với độ nhạy. Thông thường, chúng 
ta muốn so sảnh độ nhạy của nghiên cứu (Se) và với độ nhạy hiện tại (Se,). Phương 
pháp ước tính n„ có thể dựa vào phương pháp ước tính cũ mẫu cho hai tỉ lệ [2]: 


g) 
- [z.„V5a0 —8eu) +z„¬j Se(— 5e) | Hi 
: (Se, — Se)" 
Mếu nghiên cửu muốn so sánh hai độ nhạy (se, vả Sẽ,), công thức trên có thể 
chỉnh sửa thành (cho hai nhóm độc lận]: 


+ 
[z.„\(G%, + 5e,2~8, —%,) +z„„J2ISe,—54)+S6,(f~56,)] | nại 
HH: ẻ 
: (Se,—%e,}' 
Công thức trên ước tỉnh cỡ mẫu cho hai nhóm độc lặp. Trong nhiều trường 
hợp, nhà nghiên cứu có thể so sánh độ nhạy trong cùng một nhỏm, và số hệnh 


cần thiết lä: 
ki 
n.= pc 
trong đỏ, 


A =(I—%,}%, +(1— Sẽ 1%, 
Š =(cle,)áe; —(— se, }êe, 


Vi dụ 8: Nhả nghiên cửu muốn đánh giá độ nhạy của một xét nghiệm mới 
trong việc chẩn đoán rối loạn cưng dương. Biết răng trang cộng đẳng có khoảng 
5582 người rỗi loạn cưởng dương. Nghiên cứu trước đây cho thấy độ nhạy của 
phương pháp xét nghiệm hiện hành là 85%. Nhà nghiên cửu hi vọng rằng xét 
nghiệm mi sẽ có độ nhạy 95%, và muốn tiớc tính số cỡ mẫu cẩn thiết cho 
nghiên cửu với điểu kiện a = 05 (một chiếu) vả B = 0.20. 


Với những thông tin trên, chúng ta có z„.. = |.6435, z„.„ = 0.842. 
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Dũng công thức [12|, số cũ mắu (bệnh nhân] cần thiết là: 


| 1.645./(0.86)(1 — 0.86) + 0.842./(0.95( 095) | 
ỹú„=m—————————————a'1 
(0.95 - 0.Rñ] 
Nhà nghiên cứu cẩn tuyển 75 bệnh nhân và số không mắc bệnh (tính theo tỉ 
lệ hiện hành 55%) là 75/0.55 = 136. Tỉnh chung, công trình nghiên cứu cần 31 l 
cá nhãn. 


Ví dụ 9: Miột nghiên cửu có mục tiêu là so sánh hai độ nhạy của hai phương 
pháp xét nghiệm để chẩn đoán bệnh viêm răng với mức độ ý nghĩa thống kê 51% 
(kiểm định hai chiểu) và power BŨu, Nhà nghiên cửu giả định răng xét nghiệm 
1 có độ nhạy là 66%, và xét nghiệm 2 có độ nhạy 279W. Số bệnh nhân cần thiết có 
thể ước tính như sau: 


1.86. j(0.27 + 0.66M2 - 0.27 - 0.ñá) + 0.842. /2[0.67(1 - ñ_271+ 0 ñö(1 - 0.661] 


48 


N„ 


(0.66- 0.27) 


Nếu tỉ lệ viêm răng trong cộng đẳng là 251%, số nhóm chứng cỏ thể tiớc tỉnh 
là 48/0.25 = 200. Tỉnh chung. nhà nghiễn cứu cần tuyển mộ 48 hệnh nhãn và 200 
người thuộc nhóm chứng cho công trình nghiên cứu. 


Tuy nhiên, nếu hai xét nghiệm có thể làm trên I nhóm đối tượng thi: 


A =(1—0.27)0.66+(1—0.66)0.27 = 0.5736 


¿ =(1—-.27M1.66 + (I—.66)0.27 = 3900 


Cũng thức [I4| sẽ cho ra kết quả cữ mẫu cẩn thiết: 


|1.96x (0.5736 + 0.8416-Í0.5736” —0.3900”(3+0.5736)/ 4| 


....Ỏ 
ũ.3736 xũ.390U 


Do đó, số cũ mắu cần xét nghiệm là 26 / Ú.25 = 82 (giả định răng tỉ lệ viêm 
răng là 25%). 
2.0. Cũ mẫu cha đường biểu điền RÓC (receiver operating characterisiic 


curveÌ 


Li thuyết: Đường biểu diễn ROC là một chỉ số thống kẽ phản ảnh mức độ 
phần hiệt (discrimination) bệnh và không hệnh của một phương pháp xét 
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nghiệm. Trong chẩn đoán, khi phương pháp xét nghiệm tăng độ nhạy thi độ 
đặc hiệu sẽ giảm, và ngược lại, khi độ nhạy giảm thì độ đặc hiệu tảng. ROC là 
một “thỏa hiện” giữa độ nhạy và độ đặc hiệu, để có độ nhạy và độ đặc hiệu tối 
ưu nhất. 


Đường ROC được vẽ với trục tung là độ nhạy, và trục hoành là tỉ lệ dương 
tính giả (EER - false positive rate). FER thật sự là 1 trừ cho độ đặc hiệu. Diện tích 
dưởi đường ROC được gọi là area under the curve (AUC). Mục tiêu của nghiên 
cứu chẩn đuán thường là (a) ước tính AUC, hoặc (h) so sánh các phương pháp 
xét nghiệm là so sánh AUC sao cho có ý nghĩa thống kẻ. 


Đối với nghiên cửu có mục tiêu tức tỉnh AÙC trong một khoảng tin cậy 
công thức ước tỉnh số bệnh nhãn cần thiết là [3-4]: 


, Ms 
IP 
M 


ñ 
xj /đ 
Lai 


ữ= Tm 
Ä =ãt mg —F 1n 

Chú ý: EPR = 1 - độ đặc hiệu, và TPR = độ nhạy: 

Ví dụ 10: Nhà nghiên cứu muốn tiớc tính số cỡ mắu cẩn thiết để đánh giả 
độ chính xác của MRI trung việc chẩn đoán viêm khớp xương. Khoảng 4ú cá 
nhắn có viêm khớp xương. Qua y văn, nhà nghiên cứu biết răng độ nhạy là 45 
và độ đặc hiệu là 90%, và khoảng tin cậy của AÄUC w = 10M (tức Ö.1). 


Trang đỏ: 
5sA' 47 

-+F — 
8 ñR 


li. 
R 


Với các thông tin trên, chúng ta có thể tính: R = 0.6/0.4 = 1.5, FPER = 0.1, TPR 
=0.45. Do đó, z,. = 1.2816, và z„.= 0.1257, A = 1.2816 - 0.1257 = 1.1559, ơ = 
0.3265 (các bạn có thể kiểm tra]. Từ đỏ, số cũ mẫu cần thiết là: 


032065 
n.=4 1.36 — l64 
, 0.1 


+ 


Số đối tượng nhóm chứng là l64 x 1.5 = 246. Tỉnh chung, nhà nghiên cứu 
cần lế4 + 2346 = 410 đối tượng. 
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3. Vài nhận xét 


Trong nghiên cứu khoa học, đặc biệt là những công trình nghiên cứu liễn quan 
đến cũn người vả động vật, việc xác định cỡ mẫu là một bước cực kì quan trọng. 
Quan trọng vì số lượng đổi tượng nghiên cứu quyết định ngân sách và qui mỗ 
của nghiên cửu. Ngoài ra, đứng trên quan điểm y đức, số lượng đổi tượng cũng 
liên quan đến đạo đức khoa học. Một nghiên cứu có quả ít đổi tượng sẽ không có 
khả năng kiểm định giả thuyết và kết quả chẳng có ý nghĩa gì, và nghiên cửu đó 
được xem là vi phạm đạo đức. Ngược lại, một nghiên cứu có quá nhiều đổi tượng 
hơn số cẩn thiết cũng là một vĩ phạm đạo đức, vì gây bất tiện không cần thiết cho 
những người tham gia. Đổi với các nghiên cứu về thuốc, xác định cũ mẫu củn có 
Ý nghĩa pháp lí trong việc đăng kí thuốc. Hội nghị ICH (International Conference 
an Harmonization) [5] có qui định răng các công ty dược muốn đăng kí dược 
phẩm phải đệ trình đẩy đủ hồ sơ và dữ liệu, trang đó phải có phần phương nhập 
ước tỉnh cũ mẫu. [Do đá, tuy là bước đấu trong nghiên cứu, nhưng việc xác định 
cữ mẫu là một hước trung tẫm trong thiết kế nghiên cứu. 


Xác định cỡ mẫu là một khoa học, nhưng cũng có thể xem là một nghệ thuật. 
Tỉnh khoa học của ưức tính cữ mẫu là cơ sở li thuyết xác suất và giả định đằng 
sau mỗi cũng thức tính. Chính vi cơ sở khoa học này mả các phép tỉnh phải 
mang tính tái thiết lặn (repeatability). Nếu phương pháp tỉnh tuản được mỗ tả 
đấy đủ và mình hạch, người khác có thể đi đến cùng kết quả, và điểu đó rất quan 
trọng trong tính minh bạch. Tuy nhiên, trong thực tế thì không hẳn như thế. 
Trong một thẩm định và phản tích 446 để cương nghiên cửu đệ trình cho ủy 
han y đức ở Anh, các nhà nghiên cửu phát hiện chỉ có 134 (50) để cương mỗ 
tả cách tỉnh đẩy đủ và người khác có thể lặn lại kết quả tỉnh toán, 70% củn lại thì 
kết quả không tái lập được |6]. Đó là một kết quả bất ngờ và đảng quan tâm vì 
đây là những công trình nghiên cửu có liên quan đến con người. 


Tính nghệ thuật trong việc xác định cữ mẫu là cách chụn mức độ ảnh hưởng 
cho tính toán. Trong rất nhiễu trưởng hợp. nhà nghiên cứu không biết được mức 
độ ảnh hưởng là bao nhiều, không biết được độ nhạy hay độ chỉnh xác của một 
xét nghiệm. Nhưng những thông số nảy lại rất cần cho việc tỉnh toán cổ mẫu! Dao 
đó, nhà nghiễn cứu phải vận dụng suy nghĩ để tìm một thông số cho tỉnh toản. 
Một nghiên cứu phải cho ra kết quả có ích, do đó, thông số đó phải có ý nghĩa 
thực tế hay ý nghĩa lãm sảng. Cần phải nhân hiệt ý nghĩa thống kẻ và ý nghĩa lãm 
sàng. Khi một nghiễn cửu có cũ mẫu lớn, bất cử một khác biệt nhỏ nào cũng cỏ 
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thể có ý nghĩa thống kê (P < 0.05), nhưng không có ý nghĩa lắm sảng. Ngược lại, 
một kết quả có thể có ý nghĩa lâm sảng nhưng không có ý nghĩa thống kẻ khi cũ 
mẫu quá nhỏ. Do đó, nghệ thuật ở đây là phải chọn một thông số về ảnh hưởng 
vừa cỏ ý nghĩa thống kê và có ý nghĩa lãm sảng. Như là một hưởng dẫn chung, 
nếu mức độ ảnh hưởng (E5) khoảng Ö.1 - Ú.3 là “nhỏ, 0.3 - Ú.5 là “trung bình; và 
> ñ.5 được xem là “lớn” [7]. Việc chọn mức độ ảnh hưởng cho tính toán cỡ mẫu 
đổi hỏi nhà nghiên cửu phải suy nghĩ về vẫn để mình quan tầm và phù hợp với 
tỉnh hình thực tế. 


Tỉnh toán cử mẫu phải được thực hiện trước khi triển khai nghiên cứu. Trang 
thực tế, có tình huỗng xảy ra khi kết quả nghiên cứu không có ý nghĩa thống kẻ, 
nhà nghiên cửu bèn tỉnh toản power và số cử mẫu cần thiết để nhát hiện mức 
độ ảnh hưởng quan sát. Cách làm như thể có khi được gọi là pasf-hoc analysis 
nŸ mawer. Nhưng ước tính cữ mẫu vả tính tuần power sau khi công trình nghiên 
cứu đã hoàn tất hay sau lchi xem qua kết quả hoàn toàn không có giá trị khoa học 
và phi logic [8-9]. Cần nhớ răng power là xác suất mà một kiểm định thống kẻ 
bác bỏ giả thuyết vô hiệu khi giả thuyết vô hiệu sai; do đó, power chỉ có ý nghĩa 
khi giả thuyết vô hiệu sai. Nhưng vấn để là một kết quả không có ý nghĩa thống 
kê không nói cho chúng ta biết giả thuyết vỗ hiệu là đúng hay sai. Do đá, tính cũ 
mẫu và power sau khi đã quan sát kết quả là hàm ý giả định rằng giả thuyết vỗ 
hiệu sai nhưng lại không phù hợp với dữ liệu thực tế. Cần phải tuyệt đối tránh 
tính toán cử mẫu và power sau khi quan sát một kết quả không có ý nghĩa thống 
kẻ. Khoảng tin cậy 95% cùng cấn cho chúng ta nhiều thông tin hơn là một nhẫn 
tích hậu định về nower. 


Một số nhá nghiên cứu (đặc biệt là ở Việt Nam) có thỏi quen tỉnh toán cũ 
mẫu sao cho ăn khứp với số đối tượng họ có thể tiếp cận được hay đã có sẵn. 
Chẳng hạn như nhả nghiên cửu đã có 30 bệnh nhân, và họ cổ gắng điểu chỉnh 
các thông số trong công thức ước tính cỡ mẫu sao cho kết quả là 30. Việc làm 
này dẫn đến nhiều kết quả vô lí, chẳng hạn như sai số mẫu gần bằng với tham 
số chỉnh như tỉ lệ hiện hành! Đây là một thỏi quen, nếu không muốn nỏi là một 
sự “lươn lẹn” và phản khoa học không thể chấp nhặn trong văn hóa khoa học. 
Như để cập trên, việc ước tính cỡ mẫu phải được thực hiện trước khi triển khai 
nghiên cửu, phải được tiến hành một cách cá đâu tư suy nghĩ và nghiêm chỉnh. 


Xin nhấn mạnh một lần nữa là phương pháp tiớc tính cữ mẫu phụ thuộc vào 
mỗ hình nghiên cửu, hiến kết quả, sai sút trong kiểm định giả thuyết, và mức 
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độ ảnh hưởng. Mỗi mỏ hình nghiên cứu với mỗi loại biến kết quả có một công 
thức ước tính cữ mẫu đặc thù. Chẳng hạn như không thể dùng công thức [1] để 
ước tính cũ mẫu cho nghiên cứu so sánh một biến liên tục giữa hai nhằm nghiên 
cứu. Tuy nhiên, trong thực tế ở Việt Nam, rất nhiều nhà nghiên cứu tỉnh toản 
cử mẫu chỉ dựa vào công thức [1| cho hấu hết các mỏ hình nghiên cứu! Việc áp 
dụng công thức tỉnh toản một cách tủy tiện như thể là một sai lầm rất căn hản 
và khó chấp nhận được. Sai lầm này có khi nguy hiểm, vì cho ra kết quả sai, làm 
ảnh hưởng đến chất lượng nghiên cứu. 


Như có thể thấy qua các trưởng hựp vừa trình bảy, phương pháp tiớc tính cũ 
mẫu dựa trên một giả định rất đơn giản: cải gì nhỏ thì rất khó tìm (cẩn nhiễu cũ 
mẫu). và cải gì lớn thì đễ tìm (cẩn ít cũ mẫu). Gắn kết với cỡ mẫu là khải niệm 
power (mà có nhiễu người dịch là lực nghiên cửu, nhưng trong thực tế là độ nhạy 
của nghiên cứu}. Độ nhạy của nghiên cứu là xác suất bác bỏ giả thuyết vô hiệu 
khi giả thuyết vô hiệu sai. Cỡ mẫu cảng cao, độ nhạy cảng can; cũ mẫu cảng thấp, 
độ nhạy cũng giảm theo. Trong thực tế, có tình trạng thiểu nhất quản giữa công 
thức ước tỉnh cỡ mẫu trong để cương nghiên cửu và trang bảo cáo khoa học. Một 
phân tích mới cũng hổ trên BM] [6] cho thấy chỉ có 11 trong số 62 nghiễn cứu 
mả mỗ tả về cách tính cữ mẫu nhất quản giữa để cương và hải háo! Sự thiếu nhất 
quản như thể dẫn đến khó khăn trong diễn giải kết quả. Do đó, những thông số 
được sử dụng trong ước tính cũ mẫu cẩn phải được mỗ tả cẩn thận và rõ rằng, vì 
những thông tin này rất có ích cho việc đánh giá tính khả tín của kết quả nghiên 
cứu. Những vỉ dụ trong bái này chủ yếu liên quan đến nghiên cửu y khoa (vốn đa 
dạng), nhưng cũng áp dụng cho các nghiên cứu xã hội học. Hi vọng rằng những 
chỉ dẫn trên đây sẽ giúp cho các nhả nghiên cứu hiểu hơn về ý tưởng và ý nghĩa 
của việc ưức tính cữ mẫu cho một công trình nghiên cứu khoa học. 
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Có rất nhiều sách về phân tích thống kẻ sử dụng R và sách hướng dẫn sử dụng 
phần mềm R đã được xuất bản trang thời gian 2ñ năm qua. Sách tiếng Việt thi 
củn rất hiếm. Bạn đọc có thể tham khảo cuốn “Phân tích dữ liệu với R” và 
cuẩn "Phản tích dữ liệu với H: Hỏi và đáp” của tỏi, do Nhà xuất bản Tổng hợp 
Thánh phố Hỗ Chỉ Minh xuất bản và phát hành. 
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Vài nét về tác giả 


FTTtác giả là một nhà nghiên cứu cao cấp (Senior Principal Fellow) và đứng 
1 đấu một laboratory chuyên nghiền cửu về di truyền và dịch tế học loãng 
xương của Viện nghiên cứu Y khoa Garvan (Australia). Ông còn giữ 3 chức danh 
giảo sư tại Ức: Giáo sư khoa y của Đại học New South Wales, Giáo sư y khoa tiên 
lượng của Đại học Công nghệ 5ydney (UTS), và giáo sư dịch tế học thuộc Đại 
học Natre Dame Australia. CÏÍ Việt Nam, ông là giản sư xuất sắc (IDistinguished 
Professor} của Đại học Tön Đức Thăng, Giáo sư danh dự của Đại học Dược 
Hà Nội, Giáo sư thỉnh giảng của Đại học Y Hà Nội. Ông còn là Giám đốc chương 
trinh nghiên cửu về cơ và xương tại Trường Đại học Tòn Đức Thăng (bmr.tdt. 
edu.vn}. Ông là người Việt duy nhất được bẩu làm Viện sĩ Viện Hàn Lãm Y Học 
Äustralia. 

Ông là tác giả của trên 300 công trình nghiên cứu khoa học được công bổ 
trên nhiểu tập san nổi tiếng trên thể giới như Nature, Science, Nature Genetics, 
FAMA, Lancet, New England laurnal nƑ Medicine, v.v... Những nghiên cứu của 
tác giả có tác động lớn, với hơn 30.000 trích đẫn, và chỉ số H của tác giả là 87, 
đứng vào hàng Ú,1% trên thể giới. Tắc giả là một trong một trong lũ nhà khoa 
học gốc Việt có nhiều trích dẫn nhất trên thế giới. Tắc giả còn là chuyên gia bình 
duyệt cho trên 2 tập san y khoa trên thể giới, và duyệt đơn tải trợ nhiễu cơ quan 
tài trợ của Mĩ, Âu châu, Á châu. 


Ở Việt Nam, tác giả đã từng giảng dạy về y học thực chứng và phương pháp 
nghiên cửu khoa học trong suốt 15 năm qua cho hơn một ngàn học viễn trên 
khắp miễn đất nước. ng cũng đã xuất bản 12 cuẩn sách ở Việt Nam. Sách của 
ông viết về y khoa, giáo dục, khoa học và nghiên cứu khoa học. Tác giả từng 
nhận giải thưởng của Bộ trưởng Ngoại giao Việt Nam năm 2004, và giải thưởng 
“Vĩnh danh Nước Việt” năm 2005, Giải Sách Hay (2013), và một số giải thưởng 
của Ủy ban Nhãn đân Thành phố Hồ Chí Minh, Hội Y học Thành phố Hồ Chỉ 
Minh, và Hội Loäng xương Thành nhổ Hỗ Chỉ Minh. 
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